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爱丽 丝 :“ 请 你 告诉 我 该 往 哪个 方向 走 。 

妆 郡 猫 :“ 这 取决 于 你 要 到 哪里 去 。” 

爱丽 丝 :“ 我 并 不 在 乎 要 到 哪里 去 。” 

数 那 猫 :“ 那 你 走 哪 条 路 都 没关系 。” 

爱丽 丝 解释 道 :“ 我 只 想 去 任何 一 个 地 方 。” 

柴 郡 猫 :“ 你 一 定 能 够 实现 这 个 愿望 ,只 要 你 走 的 够 远 就 可 以 了 。” 


那 还 是 2014 年 ,我 开始 研读 英国 学 者 舍 恩 伯 格 的 经 典 之 作 (大 数据 时 
代 : 生活 、 工 作 与 思维 的 大 变革 》, 被 其 中 的 恢宏 描述 震撼 到 了 。 之 后 又 看 
了 中 国学 者 涂 子 沛 的 (大 数据 ) 等 相关 著作 ,进一步 被 大 数据 战略 ,数据 革 
命 、 数 据 帝 国 、 数 据 治 国 、 数 据 开 放 、 大 趋势 .大 挑战 以 及 大 变革 等 词汇 所 打 
动 。 随 后 ,我 开始 郑重 思考 自己 所 在 团队 一 一 中 国人 民 大 学 电子 证 据 研 究 
小 组 (我 们 自称 * 人 大 团队 ”) ,在 法 学 研究 方面 该 不 该 向 大 数据 法 律 和 司法 
方向 转型 。 这 时 ,我 看 到 了 当时 网 上 风靡 的 帖子 , 它 以 (爱丽 丝 梦游 仙境 》 
的 场景 为 例 , 讲 述 了 大 数据 技术 中 数据 挖掘 的 魅力 一 一 任何 业务 问题 都 可 
以 转换 为 数据 挖掘 问题 。 我 理解 ,这 是 大 数据 时 代 的 寓言 。 

“人 大 团队 ”并 不 是 一 个 严谨 的 学 术 机 构 , 它 是 由 人 大 法 学 院 、 信 息 学 
院 、. 信 息 资源 管理 学 院 的 师 生 基于 共同 的 兴趣 走 到 一 起 形成 的 。 它 也 有 研 
究 平台 和 实务 平台 ,前 者 包括 人 大 法 学 院 的 证 据 学 研究 所 、 网 络 犯罪 与 安 
全 研究 中 心 .知识 工程 与 数据 工程 教育 部 重点 实验 室 等 ;后 者 包括 中 国人 
民 大 学 物证 技术 鉴定 中 心 、 人 大 法 学 院 证 据 学 实验 室 等 。 后 来 ,我 们 又 陆 
续聘 请 了 公检法 纪 以 及 公证 、 鉴 定 机 构 、 科 研 院 所 等 部 门 朋友 参加 。 逐 渐 
壮大 了 队伍 ,形成 了 覆盖 电子 证 据 全 行业 的 规模 。 有 了 共同 的 研究 旨 趣 ， 
“人 大 团队 ”做 了 很 多 针对 电子 证 据 的 法 律 与 技术 交叉 、 理 论 与 实务 跨 界 的 


工作 ,在 电子 证 据 的 法 治 建设 、 理 论 创 新 .实务 推动 方面 做 得 颇 有 声色 。 
“人 大 团队 ”并 没有 名 义 上 的 负责 人 ,我 的 恩师 何 家 弘 教授 算是 “精神 领 
袖 ”。 早 在 2000 年 9 月 ,他 访问 日 内 瓦 国际 电信 联盟 等 机 构 归 来 ,敏锐 地 决 
策 要 认真 研究 电子 证 据 问 题 . 和 1 这 是 “人 大 团队 ”面向 IT 时 代 的 一 次 布 
局 。 事 实证 明 , 此 次 布局 是 非常 有 远见 的 , 且 相 当成 功 的 。 

那么 “人 大 团队 ”在 DT 时 代 该 做 出 什么 样 的 贡献 呢 ? 变 与 不 变 , 就 是 
首先 面 对 的 问题 。 一 方面 ,“ 大 数据 泛滥 ”。 许多 人 “ 言 必 大 数据 ”, 但 真 真 
假 假 . 虚 虚 实 实 ,浮夸 的 成 分 不 少 。 大 数据 能 否 支 撑 一 个 时 代 , 能 和 否 改 变 社 
会 方方面面 ,当时 尚 不 明确 。 即 便 大 数据 技术 就 是 时 代 性 的 ,我 国 是 否 需 
要 配套 的 司法 治理 ,法 治 建设 ,也 令 人 疑惑 。“ 人 大 团队 ”一 旦 转型 ,能 否 一 
如 既往 地 形成 独特 优势 ,也 需要 琢磨 。 另 一 方面 ,“ 法 律 人 不 能 缺席 大 数 
据 *。 大 数据 是 一 座 巨 大 的 金 矿 ,法 治 的 阳光 不 能 照 炮 到 是 不 可 能 的 。 
2013 年 美国 奥巴马 总 统 (“ 大 数据 总 统 ”) 将 之 定义 为 “未 来 的 新 石油 ”, 将 
“大 数据 战略 "上升 为 国家 意志 ,声称 未 来 对 数据 的 占有 和 控制 甚至 将 成 为 
国家 核心 资产 。 就 国内 而 言 ,2011 年 温州 动车 事故 也 开始 让 人 们 领略 到 了 
社交 大 数据 的 威力 。 当 年 7 月 23 日 20 时 30 分 05 秒 , D301 次 列车 与 
D3115 次 列车 在 温州 发 生动 车 组 列车 追尾 事故 。 在 专案 组 成 立 之 前 ,新 浪 
公司 就 发 布 了 3286883 条 关于 这 起 事件 的 微 博 ; 之 后 ,基于 700 多 万 条 微 博 
制作 了 视频 ,从 事故 现场 . 寻 人 、 遇 难 名 单 、 献 血 现场 等 多 角度 展示 这 次 突 
发 事件 的 真相 。 至 此 ,我 冥 冥 中 受 4 爱 丽 丝 梦游 仙境 》 柴 郡 猫 说 法 的 启示 ， 
决定 拓展 团队 研究 范围 。 

事实 证 明 , 这 一 决策 是 正确 的 。 大 数据 发 展 的 潮流 是 不 可 抗拒 的 ,大 
数据 法 律 和 司法 的 改变 也 是 蝇 需 的 。 中 国 计 算 机 学 会 大 数据 专家 委员 会 
在 “2013 年 中 国 大 数据 发 展 白皮书 与 2014 年 大 数据 发 展 趋势 预测 ”报告 中 
论断 ,2014 年 将 是 大 数据 从 “概念 ”走向 “价值 ”的 元 年 。2015 年 后 ,我 国 的 
大 数据 发 展 急剧 加 速 : 7 月 ,《 国 务 院 办 公 厅 关于 运用 大 数据 加 强 对 市 场 主 


[51] 何 家 弘 主编 :《 电 子 证 据 法 研究 ), 前 言 部 分 1 一 2 页 ,北京 ,法 律 出 版 社 ,2002。 


体 服 务 和 监管 的 若干 意见 》 发 布 ,提出 运用 大 数据 加 强 对 市 场 主体 的 服务 
和 监管 ;8 月 ,国务 院 发 布 (促进 大 数据 发 展 行动 纲要 》, 推 动 各 行业 大 数据 
发 展 ,强调 数据 资源 共享 开放 ;10 月 ,党 的 十 八 届 五 中 全 会 明确 提出 “国家 
大 数据 战略 ”; 今 年 3 月 “十 三 五 ?规划 纲要 出 台 , 再 次 强调 国家 大 数据 战 
略 。 司 法 系统 也 开始 加 入 大 数据 的 时 代 潮 流 。 仅 就 公开 的 新 闻 报 道 来 看 ， 
今年 下 半年 中 央 政 法 委 和 孟建柱 书记 、 最 高 人 民 检 察 院 曹 建 明 检察 长 . 李 如 
林 副 检察 长 等 纷纷 率 团 调研 贵州 大 数据 交易 中 心 ,为 "大 数据 十 司法 ?进行 
布局 。 尤 其 是 2016 年 10 月 21 日 ,上 午 高 检 院 召开 了 大 数据 应 用 研究 会 
下 午 中 政委 请 马云 给 富 汪 政法 队 搓 计 要 大 坟 扩 生 科 技术 六 在 社 委 消 间 中 
的 运用 。 大 数据 法 律 共 同体 已 经 全 面 行动 。 

“人 大 团队 ” 较 早 地 转向 大 数据 法 律 研究 ,也 就 是 打开 了 另外 一 扇 窗 。 
2015 年 5 月 13 日 ,我 第 一 次 受 邀 给 全 国 军 队 保 卫 部 门 讲授 (大 数据 侦查 与 
大 数据 证 据 》, 获 得 了 良好 的 赞誉 ,尽管 当时 的 认识 还 不 够 深入 。 此 后 ,我 
陆续 以 《大 数据 时 代 网 络 安 全 问题 与 挑战 闪 大 数据 推动 检察 办 案 变 革 闪 大 
数据 在 检察 办 案 中 的 运用 (大 数据 在 纪律 审查 中 的 运用 ) 等 为 题 开讲 ,得 
到 了 越 来 越 多 的 认同 ,在 此 过 程 中 也 与 一 线 办 案 同志 交流 了 宝贵 经 验 。 实 
务 中 ,我 们 积极 改造 所 熟悉 的 手机 取证 业务 ,拓展 基于 大 数据 取证 的 司法 
鉴定 工作 ,并 在 个 案 中 获得 成 功 。 我 们 还 敏锐 地 发 现 ,几乎 所 有 的 大 数据 
公司 都 通过 手机 APP ,收集 广大 用 户 位 置 等 信息 ,而 这 一 现象 将 会 极 大 地 
改变 现 有 的 侦查 制度 .证据 制度 和 权利 保障 制度 。2015 年 12 月 ,每 年 一 度 
的 网 络 犯罪 高 峰 论 坛 召 开 ,我 代表 团队 就 “大 数据 的 证 据 价值 .侦查 模式 与 
权利 保障 发言 ,以 丰富 的 实践 案例 和 直观 的 技术 图 示 吸 引 了 场 内 外 广大 
专家 学 者 的 热 议 。 

今天 看 来 ， 万 物 缘 数据 "数据 司法 是 未 来 科技 司法 的 主 方向 ”， 司 
法 人 员 将 越 来 越 离 不 开 大 数据 引领 ”等 言论 , 越 来 越 成 为 新 的 共识 。 这 些 
规律 我 们 较 早 地 感受 到 了 ,也 作 了 一 些 有 益 的 探索 与 推动 。“ 人 大 团队 ”在 
许多 场合 都 呼吁 ,我 国 的 网 络 安 全 、 反 贪 侦查 、 纪 律 审查 、 食 安 执 法 、 网 信 执 
法 .文化 执法 等 工作 都 应 加 强大 数据 的 运用 ,深化 同 大 数据 公司 的 合作 , 同 


大 数据 侦查 


时 有 效 规制 大 数据 的 安全 与 共享 问题 ,并 能 够 给 出 具体 的 方案 。 

大 数据 法 律 与 司法 问题 归根 到 底 是 下 一 代 年 轻 人 的 舞台 。 在 这 一 进 
程 中 ,“ 人 大 团队 ”很 多 年 轻 人 开始 持续 发 力 。 谢 君 泽 老师 在 挖掘 电子 文档 
痕迹 方面 有 着 独到 的 认识 ,他 基于 对 批量 产生 的 文档 痕迹 进行 分 析 , 成 功 
地 协助 查办 了 国家 审计 署 审 计 华 润 公司 煤矿 并 购 的 泄密 案件 .天 津 港 
8 12 爆炸 案 之 安 评 部 门 渎职 犯罪 案件 等 。 我 去 微软 中 国 公司 交流 时 , 方 
得 知 这 可 以 叫做 “大 痕迹 数据 ?。 君 泽 虽 不 是 我 名 下 的 学 生 , 但 却 是 辅助 我 
时 间 最 长 .最 得 力 的 助手 和 骨干 , 现 已 名 声 在 外 ,前 途 无 量 。 徐 菲 . 张 杨 杨 、 
郭 树 正 同学 很 早 就 配合 我 对 电子 定位 技术 进行 研究 ,探索 收集 APP 背后 
的 IP 地址 .MAC 地 址 等 大 数据 的 方法 ,并 已 日 至 成 熟 ; 周 迪 、 吕 宏 庆 同学 
擅长 互联 网 数据 挖掘 ,对 网 络 与 情 分 析 、 数 据 夯 像 及 数据 碰撞 等 率先 探索 ; 
陈 泽 鸿 , 张 洪 铭 同学 积极 试用 人 大 信息 学 院 开 发 的 “时 事 探 针 ?平台 ,试探 
性 地 绘制 了 我 国 的 反腐 败 指数 图 、 网 络 犯罪 指数 图 ; 张 艺 上 页 、 黄 格 同 学 较 早 
借鉴 国外 OPEN DATA” 机 制 , 对 国内 公开 数据 库 如 何 归 整 利用 进行 实 
验 ; 胡 联 同学 运筹 帷 惧 ,组 织 团 队 对 BAT 公司 调研 ,推动 网 信和 部门 和 检察 
部 门 建 立 大 数据 公司 有 效 协 查 调 证 机 制 ; 王 炮 同学 撰写 (职务 犯罪 侦查 的 
大 数据 模式 初探 一 文 ,展示 了 反 贪 工作 中 借助 大 数据 的 现实 与 前 景 …… 
这 样 的 优秀 学 生 很 多 ,他 们 以 自己 的 方式 在 感受 大 数据 时 代 的 脉搏 。 

此 外 ,“ 人 大 团队 ”特别 注意 与 外面" 的 大 数据 专家 合作 。“ 外 脑 ” 的 指 
导 对 于 我 们 开展 研究 起 到 了 关键 性 的 作用 。 例 如 ,人 大 信息 学 院 院 长 文 继 
荣 教 授 曾 经 长 期 任职 于 微软 公司 ,我 们 多 次 登门 拜访 求教 大 数据 知识 , 文 
教授 不 音 解 惑 ,并 无 偿 向 我 们 提供 了 “时 事 探 针 ” 应 用 平台 ,还 根据 我 们 的 
需要 特意 对 中 国 裁 判 文书 网 的 海量 裁判 文书 进行 大 数据 分 析 ; 人 大 公共 决 
策 实验 室 王 克 平 主任 多 次 为 我 们 提供 最 先进 的 大 数据 可 视 化 展示 实验 室 ， 
不 大 其 烦 地 展示 大 数据 在 公共 决策 司法 办 案 中 的 运用 ;人 大 信息 资源 管 
理学 院 的 钱 表 等 教授 也 伸 出 援手 ,协助 我 们 成 功 申报 国家 社 科 基金 项 目 
“大 数据 时 代 电 子 文件 的 证 据 规 则 与 管理 法 制 建设 研究 ”, 促 成 了 一 个 跨越 
法 学 与 电子 文件 管理 学 的 大 数据 研究 机 会 。 中 国 科学 院 高 能 物理 研究 所 


的 许 榕 生 教 授 、 香 港大 学 K. P. Chow 教授 也 不 音 赐教 ,分 享 了 他 们 在 大 数 
据 分 析 及 预测 方面 的 宝贵 经 验 。 还 要 特别 感谢 来 自我 挂职 的 检察 系统 ,以 
及 检察 行业 的 朋友 。 他 们 让 我 们 看 到 了 大 数据 与 检察 工作 、 大 数据 平台 建 
设 、 大 数据 预防 、 大 数据 初 查 、 大 数据 侦查 、 大 数据 管理 ,大 数据 挖 扎 、 大 数 
据 碰撞 、 大 数据 画像 等 鲜 活 例子 ,也 讲授 了 他 们 在 实务 中 积累 的 宝贵 经 验 。 
大 数据 转型 研究 之 路 上 ,这 样 的 同道 者 ,我们 有 很 多 很 多 ,铭记 于 心 。 

王 燃 博士 也 是 ”人 大 团队 "一 员 , 是 最 值得 称赞 的 大 数据 法 律 制度 探索 
者 。 我 依稀 记得 她 初 到 人 大 法 学 院 证 据 学 教研 室 的 场景 。 那 一 年 级 共有 
五 位 法 学 硕士 ,她 看 起 来 话 不 多 ,抽签 师 从 我 的 恩师 何 家 弘 教授 ( 跟 我 同辈 
呢 ) 。 不 过 ,我 也 给 她 上 课 , 带 着 她 做 项 目 。 硕 士 两 年 .博士 三 年 下 来 ,她 给 
我 的 印象 一 一 不 是 最 聪明 的 学 生 , 但 却 变 有 智慧 ,更 是 执行 力 超 强 。 马 云 
说 过 ,大 数据 时 代 电 脑 一 定 比 人 类 聪明 ,但 人 类 永远 比 电脑 有 智慧 。 王 燃 
是 不 是 ”人 大 团队 ”中 的 有 智者 呢 ? 天 知道 ,反正 她 选择 了 大 数据 法 律 和 司 
法 作为 研究 方向 。 

忘 了 是 什么 时 候 , 她 征询 我 关于 博士 研究 方向 的 建议 。 我 可 能 随口 说 
了 大 数据 法 律 问题 研究 很 有 前 景 。 其 时 我 的 内 心 想法 是 ,团队 必须 研究 大 
数据 法 律 问 题 ,但 这 个 主导 者 可 能 未 必 是 她 。 结 果 她 认真 了 ,很 快 拿 出 了 
文献 综述 和 写作 提纲 。 而 这 个 题目 对 于 她 而 言 , 显 然 是 有 相当 难度 的 。 她 
既 没 有 技术 背景 ,也 对 实务 不 其 了 解 ,还 不 了 解 海外 发 展 情况 。 谁 知道 她 
会 怎么 切入 研究 ”她 会 不 会 做 出 成 果 ? 

她 的 智慧 就 是 “认定 了 就 做 "。 她 挤 出 时 间 到 北京 市 检察 院 挂职 ,尽快 
了 解 实务 ;她 访 学 台湾 地 区 ,了 解 境外 情况 ;她 更 上 枉 准 时 机 向 各 位 老师 求 
教 ,博采众长 ;她 还 虚心 向 法 律 硕士 的 师弟 师妹 们 学 习 手 机 取证 ,大 数据 分 
析 等 经 验 ,弥补 了 自己 技术 盲 的 短 板 。 我 记得 博士 论文 开题 时 ,她 拿 出 了 
一 份 “不 太 好 ”的 写作 提纲 。 导 师 组 建议 重新 梳理 另起炉灶 ,而 我 直接 提议 
她 集中 研究 当时 已 经 热 兴 的 大 数据 侦查 , 写 透 大 数据 侦查 的 思维 、 模 式 、 措 
施 、 制 度 等 基础 问题 。 没 想到 ,半年 后 她 真 的 如 样 交 出 了 论文 稿 。 当 然 , 她 
也 付出 了 身心 交 冶 的 代价 ,她 经 常 跟 熟 悉 的 同学 开玩笑 说 最 后 悔 读 博 士 
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了 , 弄 得 一 脸 癌 。 其 实 , 她 博士 论文 答辩 通过 时 满 是 喜悦 ,在 场 的 每 个 人 都 
能 够 感受 到 她 的 心情 。 几 个 月 后 ,她 便 将 博士 论文 修改 完善 出 版 ,这 也 是 
执行 力 强 的 明证 。 

当前 我 国政 法 系统 正 积极 向 大 数据 技术 靠拢 ,向 大 数据 战略 转型 。 这 
时 收 到 她 4 大 数据 侦查 ) 专 著 文 稿 , 我 也 非常 欣慰 。“ 人 大 团队 ”终于 有 成 员 
拿 出 了 大 数据 法 律 的 第 一 本 专著 ,这 应 该 也 是 国内 的 第 一 本 大 数据 侦查 论 
著 。 我 想 , 这 就 像 我 2004 年 出 版 (中 国电 子 证 据 立 法 研究 ) 专 著 一 样 ,走出 
第 一 步 就 意味 着 良好 的 学 术 开 端 。 我 相信 ,她 还 会 推出 诸如 《大 数据 证 据 》 
《大 数据 权利 法 律 保护 ) 之 类 的 * 几 部 曲 ”。 据 我 了 解 , 她 的 论文 (大 数据 时 
代 侦 查 模 式 的 变革 及 其 法 律 问题 研究 ) 荣 获 了 第 11 届 中 国法 学 青年 论坛 
主题 征文 一 等 奖 , 她 以 “大 数据 侦查 与 大 数据 证 据 ”* 开 启 了 天 津 大 学 的 “ 北 
洋 法 学 学 术 沙 龙 "第 一 讲 , 她 还 受 邀 给 全 国 检察 机 关 第 一 次 大 数据 专 班主 
讲 “ 大 数据 证 据 *”。 刀 露头 角 的 她 ,会 在 这 条 道路 上 走 好 走 远 ! 

以 我 的 学 术 眼 光 , 王 燃 博士 的 (大 数据 侦查 ) 一 书 具有 相当 的 创新 性 : 
一 是 概念 的 全 面 创新 。 她 构建 起 大 数据 侦查 较为 完整 的 框架 ,包括 概念 、 
思维 、 模 式 \ 方 法 及 相关 制度 构建 等 。 二 是 重要 观点 具有 前 瞻 性 。 本 书 很 
多 观点 是 在 博士 论文 中 表达 的 ,当时 提出 的 很 多 观点 现在 看 来 具有 相当 的 
前 脆性 ,并 已 逐渐 被 证 实 。 例 如 , 书 中 揭示 了 大 数据 热潮 下 的 一 些 思维 误 
区 ;强调 大 数据 相关 思维 和 预测 思维 在 侦查 中 的 广泛 运用 前 景 ,尤其 是 预 
测 性 , 必 将 推动 事后 侦查 向 事前 侦查 、 预 测 侦查 转型 ; 提出 大 数据 侦查 的 模 
式 , 强 调 从 数据 空间 去 寻找 突破 点 ;提出 大 数据 搜索 、 大 数据 碰撞 、 大 数据 
画像 、 大 数据 挖掘 、 犯 罪 热点 分 析 、 犯 罪 网 络 分 析 、 大 数据 公司 取证 这 几 种 
大 数据 侦查 的 具体 方法 ,已 经 越 来 越 为 实务 部 门 所 开发 运用 ;强调 大 数据 
侦查 在 发 展 技术 、 应 用 的 同时 ,要 注意 其 所 带 来 的 法 律 问题 以 及 对 传统 法 
律 原理 ,规则 的 冲击 ,应 当 对 大 数据 侦查 进行 一 定 的 程序 规制 。 诚 然 ,这 本 
书 也 难免 有 幼稚 和 错误 之 处 ,这 有 赖 于 读者 们 的 慧眼 识别 。 

马云 还 说 过 ,“ 整 个 大 数据 时 代 最 重要 的 事情 ,是 要 做 到 “事前 诸葛 亮 ， 
就 是 要 有 预防 机 制 ”。《 大 数据 侦查 ) 一 书 在 某 种 程度 上 也 是 “事前 诸葛 





亮 %。 王 燃 博士 是 不 是 在 两 年 前 就 预测 到 了 “大 数据 十 司法 ”在 今天 的 热 络 
呢 ? 是 不 是 也 昭示 着 “大 数据 X 司 法 ”在 未 来 的 突起 呢 ? 

大 数据 时 代 是 充满 无 限 生 机 的 时 代 , 也 是 一 切 都 有 可 能 的 时 代 。 王 燃 
博士 出 版 (大 数据 侦查 》 为 人们 提供 了 一 个 “此 和 郡 猫 ” 智 慧 的 小 样本 。 同 时 ， 
本 书 的 出 版 也 为 "人 大 团队 ?的 大 数据 之 行 留 下 了 一 个 印记 。 我 相信 ,这 本 
书 开卷 有 益 。 我 期 望 ,“ 人 大 团队 ”在 DT 时 代 做 出 新 的 华丽 转身 。 


刘 品 新 
2016 年 10 月 22 日 写 于 拉萨 


自 序 


本 书 的 设想 最 早 形成 于 2014 年 11 月。 尽管 当时 我 国 官方 尚未 提出 大 
数据 战略 ,但 大 数据 技术 已 经 在 电子 商务 .互联 网 、 金 融 等 先驱 领域 开始 运 
用 ,国际 上 也 有 很 多 国家 相继 开启 了 "大 数据 革命 "。 欧 盟 委 员 会 早 在 
2010 年 就 提出 了 “欧盟 开放 数据 战略 ”; 联 合 国 推出 了 “全 球 脉动 ”(Global 
Pulse) 计 划 ,建立 世界 范围 内 的 预警 机 制 。 美 国 . 日 本 英国, 法 国 、 韩 国 、 新 
加 坡 、 印 度 等 国都 将 大 数据 纳 和 人 了 国家 发 展 计划 。 22 彼 时 ,笔者 开始 意识 
到 大 数据 巨大 的 发 展 潜力 和 前 景 ,并 考虑 在 侦查 领域 .司法 领域 推广 大 数 
据 战略 的 可 能 性 。 结 合 我 国 当 时 的 信息 化 侦查 水 平 、 网 络 侦查 制度 .电子 
取证 等 技术 的 运用 ,又 了 解 了 其 他 国家 大 数据 在 司法 领域 的 运用 情况 ,如 
在 美国 刑事 侦查 中 “大 数据 预测 警 务 " 技 术 (predictive policing) ,美国 民事 
诉讼 电子 证 据 开 示 中 的 “大 数据 智能 检索 ”技术 (predictive coding) 等 。 笔 
者 认为 ,大 数据 在 我 国 的 侦查 领域 将 有 广阔 的 运用 前 景 。 

近 几 年 大 数据 的 热 兴 也 印证 了 笔者 的 想法 。 各 侦查 部 门 纷纷 搭建 大 
数据 应 用 平台 ,发 展 大 数据 侦查 技法 ,提出 “智慧 公安 “科技 强 检 ”等 口号 。 
但 目前 实践 中 各 侦查 部 门 的 大 数据 运用 尚 处 于 摸索 阶段 ,并 没有 形成 统一 
制度 ,相关 技术 方法 的 运用 尚 不 成 熟 , 相 关 权 利 、 程 序 缺 乏 法 律 保障 。 针 对 
侦查 实务 中 大 数据 运用 的 莲 勃 之 景 ,笔者 以 前 瞻 性 的 视角 提出 “大 数据 侦 
查 ” 这 一 全 新 概念 ,对 大 数据 侦查 的 内 涵 、 特 征 . 思 维 方式 .技术 方法 进行 了 
归纳 和 总 结 。 另 外 ,在 发 展 大 数据 侦查 的 过 程 中 ,大 数据 本 身 的 技术 .思维 
特征 也 会 不 可 避免 地 对 一 些 传统 侦查 程序 造成 影响 ,对 公民 的 相关 权利 造 





51] 参见 工业 和 信息 化 部 电信 研究 院 :《 大 数据 白皮书 》( 非 出 版 物 ) ,2014 年 5 月 , 载 工业 和 
信息 化 部 网 , http://www. miit. gov. cn/n1146312/n1146909/n1146991/n1648536/c3489505/ 
content. html,2016 年 9 月 20 日 访问 。 


成 侵害 。 基 于 这 些 问 题 ,笔者 提出 大 数据 侦查 的 程序 规制 和 权利 保障 制 
度 , 以 及 数据 共享 .技术 构建 .行业 规范 等 相关 的 配套 制度 的 建设 。 除 第 一 
章 导 论 外 ,本 书 共 分 为 五 个 章节 。 

首先 ,关于 “大 数据 ”及 “大 数据 侦查 ”的 内 涵 。 大 数据 包括 海量 数据 
集 、 数 据 处 理 技术 及 数据 分 析 结 果 这 三 层 含义 。 大 数据 不 仅仅 是 海量 数据 
的 集合 ,也 是 集 数据 处 理 .数据 分 析 于 一 体 的 技术 体系 ,同时 也 强调 反映 事 
物 背 后 规律 的 数据 分 析 结 果 。 正 确 理 解 大 数据 的 内 涵 还 需要 注意 ,大 数据 
的 基础 在 于 数据 化 ;大 数据 的 量 大 是 相对 的 ,对 于 分 析 对 象 来 说 ,达到 “ 样 
本 二 总体” 的 程度 即 可 ;大 数据 的 核心 价值 在 于 数据 背后 的 规律 而 非 数据 
本 身 , 而 数据 规律 主要 依靠 数据 挖掘 等 大 数据 技术 来 实现 。 相 比 于 小 数据 
时 代 的 思维 方式 ,大 数据 具有 全 数据 、 混 杂 性 以 及 相关 性 的 特征 :全 数据 意 
指 人 们 完全 可 以 获取 某 个 研究 对 象 的 所 有 数据 ,不 需要 再 通过 抽样 调查 的 
方式 进行 统计 ;混杂 性 意 指 不 需要 每 个 数据 都 精确 无 误 ,数据 的 量 大 可 以 
抵消 部 分 数据 的 不 准确 ;相关 性 则 是 指 大 数据 颠覆 了 人 类 长 久 以 来 的 因果 
关系 思维 ,大 数据 能 够 快速 告诉 我 们 事物 之 间 的 相关 关系 是 什么 , 却 无 法 
解释 背后 的 原因 。 

在 此 基础 上 ,笔者 对 大 数据 侦查 的 内 涵 和 外 延 进行 界定 。 从 狭义 上 来 
说 ,大 数据 侦查 强调 采用 大 数据 技术 的 侦查 行为 。 大 数据 侦查 是 指法 定 侦 
查 机 关 针 对 已 发 生 或 尚未 发 生 的 犯罪 行为 ,为 了 查 明 犯罪 事实 ` 抓 捕 犯 罪 
嫌疑 人 人、 预测 犯罪 等 ,所 采取 的 一 切 以 大 数据 技术 为 核心 的 相关 侦查 行为 。 
具体 而 言 ,大 数据 侦查 的 主体 是 法 定 侦查 机 关 , 侦查 的 对 象 是 已 经 发 生 或 
尚未 发 生 的 犯罪 行为 ,侦查 的 目的 是 查 明 犯罪 事实 及 预防 犯罪 活动 的 发 
生 , 侦 查 的 内 容 是 涉及 大 数据 技术 的 一 切 侦查 行为 。 从 广义 上 来 说 ,大 数 
据 侦查 不 仅仅 指 技术 层面 的 侦查 措施 ,而 是 包括 大 数据 侦查 思维 、 侦 查 模 
式 、 侦 查 机 制 等 完整 体系 。 相 比 于 传统 侦查 而 言 , 大 数据 侦查 具有 以 下 特 
征 : 侦 查 空间 的 数据 化 ,大 数据 侦查 在 平行 的 数据 空间 中 展开 ,找到 与 物理 
空间 人 、 物 相对 应 的 数据 形式 ;侦查 技术 的 智能 化 ,大 数据 本 身 就 集 人 工 智 
能 ,计算 机 等 多 个 学 科 于 一 体 ,数据 收集 、 数 据 清 洗 到 数据 分 析 的 每 一 个 环 





“ss 
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节 都 离 不 开机 器 的 支持 ,因此 大 数据 侦查 技术 必然 也 具有 智能 化 的 色彩 ; 
侦查 思维 的 相关 性 ,传统 的 侦查 是 一 个 由 果 溯 因 的 重 构 犯 罪过 程 ,建立 在 
相关 性 基础 上 的 大 数据 侦查 改变 了 这 一 传统 逻辑 ,直接 通过 数据 运算 去 发 
现 各 要 素 之 间 的 关系 ,从 而 发 掘 侦查 线索 。 大 数据 侦查 作为 一 个 全 新 的 概 
念 ,也 需要 厘清 其 与 技术 侦查 、 侦 查 技术 ,信息 化 侦查 、 情 报导 侦 等 概念 之 
间 的 关系 。 大 数据 侦查 与 技术 侦查 是 交叉 关系 .大 数据 侦查 中 对 某 些 数据 
的 收集 需要 遵守 技术 侦查 的 规制 ;大 数据 侦查 从 属于 侦查 技术 的 范畴 ;大 
数据 侦查 与 传统 的 信息 化 侦查 、 情 报导 侦 之 间 是 传承 与 发 展 的 关系 ,大 数 
据 侦查 建立 在 信息 化 侦查 、 情 报导 侦 的 多 年 发 展 基础 之 上 ,同时 又 大 大 推 
动 了 二 者 的 发 展 。 在 目前 的 侦查 实务 中 ,大 数据 主要 作为 线索 运用 ,但 不 
排除 大 数据 在 将 来 会 成 为 一 种 新 的 证 据 形 式 。 总 而 言 之 ,大 数据 侦查 有 利 
于 推动 事后 侦查 向 事前 侦查 转型 ,被 动 侦查 向 主动 侦查 转型 ,单线 侦查 向 
协作 式 侦查 转型 ,粗放 式 侦查 向 集约 式 侦查 转型 , 它 必 将 引领 未 来 侦查 发 
展 的 新 方向 。 

其 次 ,关于 大 数据 侦查 的 思维 特征 。 笔 者 结合 大 数据 本 身 的 特征 和 其 
在 侦查 中 的 实务 运用 ,提出 了 相关 性 、 整 体 性 和 预测 性 三 大 特征 。 相 关 性 
思维 能 够 告诉 人 们 事物 之 间 的 关联 性 但 不 能 解释 为 什么 。 利 用 相关 性 , 侦 
查 人 员 可 以 找到 犯罪 现象 的 关联 物 , 通 过 关联 物 来 观察 犯罪 行为 本 身 ; 还 
可 以 通过 大 数据 的 相关 性 分 析 发 现 更 多 隐藏 的 线索 。 整 体 性 思维 强调 大 
数据 时 代 取 证 思维 的 整体 性 和 事实 认定 的 整体 性 ,在 整体 数据 中 寻找 与 案 
件 有 关 的 数据 ,在 整体 事实 中 选取 与 案件 有 关 的 事实 。 预 测 性 思维 则 强调 
对 未 来 时 空 犯罪 活动 的 预测 ,包括 对 人 、 案 及 整体 犯罪 趋势 的 预测 ,从 而 有 
利于 侦查 人 员 合 理 部 署 侦查 资源 , 防 患 于 未 然 。 当 前 ,在 “大 数据 热 ” 的 氛 
围 中 ,也 容易 产生 一 些 思维 误区 ,如 认为 数据 越 多 越 好 、 数 据 可 以 不 精确 、 
大 数据 分 析 结果 一 定 是 正确 的 ,大 数据 的 相关 性 可 以 替代 因果 性 .大 数据 
的 预测 性 违背 无 罪 推定 原则 等 。 然 而 ,大 数据 并 非 是 万 能 的 ,数据 采集 中 
会 有 偏差 ,数据 结果 也 会 受到 人 为 主观 操作 影响 ,大 数据 还 会 产生 歧视 和 
偏见 ,数据 分 析 模 型 也 会 失灵 。 另 外 ,大 数据 侦查 的 相关 性 思维 特征 还 会 


大 数据 侦查 


对 传统 司法 证 明 原理 带 来 冲击 。 如 何 去 协 调 传统 侦查 思维 与 大 数据 侦查 
思维 的 碰撞 、 如 何在 现 有 法 律 框架 内 去 发 挥 大 数据 侦查 的 思维 价值 ,是 不 
得 不 面 对 的 问题 。 

在 前 述 基础 上 ,本 书 归纳 了 大 数据 侦查 的 几 种 典型 模式 。 在 实务 中 已 
有 的 大 数据 侦查 案例 基础 上 ,笔者 从 对 象 .时 间 等 不 同 角度 将 大 数据 侦查 
提炼 为 不 同 模式 。 按 照 侦查 对 象 的 不 同 ,大 数据 侦查 可 以 分 为 个 案 分 析 模 
式 和 整体 分 析 模式 ,前 者 主要 针对 具体 个 案 的 侦破 ,后 者 则 面向 于 整体 历 
中 案件 的 多 维度 分 析 。 按 照 时 间 序列 的 不 同 ,大 数据 侦查 可 以 分 为 回溯 型 
模式 和 预测 型 模式 ,回溯 型 模式 是 针对 过 去 已 经 发 生 的 犯罪 行为 ,而 预测 
型 模式 则 是 针对 未 来 未 知 时 空 的 犯罪 ,强调 对 犯罪 活动 的 预测 。 按 照 数据 
形态 的 不 同 ,大 数据 侦查 可 以 分 为 原生 数据 模式 和 衍生 数据 模式 ,在 原生 
数据 模式 中 ,大 数据 只 是 作为 一 种 技术 、 媒 介 ,发 挥 的 是 “ 找 数据 ”功能 ,不 
会 改变 数据 的 原始 状态 ;而 在 衍生 数据 模式 中 ,大 数据 则 对 原始 数据 进行 
了 二 次 挖掘 ,发 挥 的 是 “分 析 数 据 ”功能 ,获取 的 是 新 的 数据 形态 。 从 “数据 
化 ”的 特征 出 发 ,可 以 将 大 数据 侦查 分 为 “人 一 数 一 人 ”和 *“ 案 一 数 一 案 ” 模 
式 ,前 者 是 指 在 数据 空间 找到 对 应 的 数据 化 嫌疑 人 ,后 者 是 指 在 数据 空间 
找到 对 应 的 数据 化 案件 信息 ,两 种 模式 都 遵循 着 从 具体 到 抽象 的 过 程 ,大 
数据 在 两 种 模式 中 都 扮演 着 连接 现实 空间 和 数据 空间 的 中 介 。 在 传统 “由 
案 到 人 ”和 “由 人 到 案 ” 的 基础 上 ,大 数据 侦查 可 以 分 为 * 案 一 数 一 人 ”和 
“人 一 数 一 案 ”两 种 模式 ,前 者 是 以 案件 为 中 心 去 找 嫌疑 人 ,后 者 是 以 嫌疑 
人 为 中 心 去 寻找 案件 事实 ,它们 的 共同 点 就 在 于 通过 大 数据 连接 起 案件 与 
嫌疑 人 之 间 的 关系 。 

再 次 ,本 书 介绍 了 实务 中 常用 的 几 种 大 数据 侦查 方法 ,包括 数据 搜索 、 
数据 碰撞 、 数 据 挖掘 \ 数 据 画 像 .犯罪 网 络 分 析 、 犯 罪 热 点 分 析 以 及 大 数据 
公司 取证 等 。 数 据 搜索 是 较为 简单 的 方法 ,其 原理 就 是 在 海量 数据 库 中 检 
索 出 相关 数据 ,具体 包括 数据 库 搜索 .互联 网 搜索 和 电子 数据 搜索 几 种 方 
式 .。 侦查 人 员 要 注意 发 挥 大 数据 智能 化 检索 技术 、 一 键 式 检索 技术 。 数 据 
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碰撞 意 指 通过 多 个 数据 集 之 间 的 自动 比 对 来 发 现 相关 数据 ,数据 碰撞 往往 
能 产生 意 想 不 到 的 效果 。 常 见 的 数据 碰撞 类 型 有 话 单数 据 碰 撞 、 银 行 数据 
碰撞 等 。 数 据 挖掘 是 大 数据 较 核心 的 技术 ,包括 关联 性 分 析 、 分 类 分 析 、 时 
序 分 析 等 多 种 功能 。 数 据 挖掘 的 价值 在 于 以 智能 化 方法 发 现 数据 背后 的 
深层 次 规律 ,发 掘 现象 之 间 的 联系 ,如 嫌疑 人 的 兴趣 爱好 、 行 为 偏好 等 。 数 
据 画 像 是 传统 犯罪 心理 画像 在 大 数据 时 代 的 新 发 展 , 通 过 借助 基础 数据 库 
及 数据 挖掘 技术 ,大 数据 可 以 对 嫌疑 人 进行 全 方位 .多 维度 的 数据 刻画 。 
犯罪 网 络 关系 分 析 主 要 应 用 于 忍 怖 活动 犯罪 .毒品 犯罪 等 有 组 织 的 犯罪 ， 
意 在 通过 大 数据 技术 来 发 现 犯罪 组 织 成 员 之 间 的 关系 及 其 分 工 合作 情况 。 
犯罪 热点 是 分 析 犯 罪 活 动 在 时 空位 置 上 的 分 布 规律 ,大 部 分 的 犯罪 往往 集 
中 在 少 部 分 地 区 ;犯罪 热点 分 析 还 往往 与 犯罪 预测 联系 在 一 起 ,通过 对 历 
史 犯 罪 热点 数据 的 分 析 来 预测 未 来 犯罪 活动 的 趋势 和 走向 。 在 大 数据 侦 
查 中 ,不 能 忽视 大 数据 公司 的 作用 ,大 数据 公司 所 拥有 的 海量 用 户 数 据 是 
侦查 中 的 重要 数据 来 源 , 侦 查 机 关 要 积极 寻求 与 大 数据 公司 的 数据 共享 及 
技术 合作 。 
最 后 ,本 书 论述 了 大 数据 侦查 的 相关 制度 构建 , 既 包 括 大 数据 本 身 的 
法 律 程序 构建 ,也 包括 与 之 相关 的 配套 制度 建设 。 从 权利 角度 看 ,大 数据 
侦查 难免 会 侵犯 公民 的 个 人 信息 权 。 目 前 ,刑事 侦查 中 的 个 人 信息 保护 尚 
属于 法 律 真 空地 带 。 侦 查 机 关 的 数据 收集 数据 共享 不 可 避免 地 会 形成 
“大 数据 监控 社会 ” 带 来 民众 的 心理 丽 慌 ; 侦查 中 对 个 人 数据 的 二 次 分 析 、 
深度 挖掘 更 是 对 个 人 信息 权 的 严重 侵犯 。 因 此 ,本 书 从 审查 批准 .个 人 参 
与 .比例 原则 等 方面 去 寻求 大 数据 侦查 与 个 人 信息 保护 之 间 的 价值 平衡 。 
从 程序 角度 来 看 ,大 数据 侦查 过 程 是 不 透明 的 ,当事人 不 知道 自己 的 哪些 
数据 被 收集 、 被 分 析 , 也 不 知道 自己 被 采取 侦查 措施 的 数据 依据 。 可 见 , 大 
数据 侦查 对 传统 的 正当 程序 带 来 一 定 影响 ,剥夺 了 当事人 的 知情 权 、 辩 护 
权 等 权利 。 因 此 ,本 书 从 通知 解释 、 赋 予 异 议 权 数据 记录 等 几 个 角度 去 规 
制 大 数据 侦查 的 正当 程序 。 另 外 ,笔者 还 从 数据 共享 .技术 应 用 以 及 行业 


规范 的 角度 提出 了 大 数据 侦查 相关 配套 制度 。 在 数据 共享 方面 ,要 打破 不 
同 地 域 . 级 别 .部门 之 间 的 数据 孤岛 现象 ,达到 侦查 机 关内 部 的 数据 共享 以 
及 侦查 机 关 与 社会 数据 库 共享 ;在 技术 方面 ,要 建立 大 数据 侦查 的 技术 体 
系 和 应 用 平台 ;在 行业 规范 方面 ,大 数据 公司 要 加 强 对 个 人 数据 的 分 级 、 分 
类 管理 ,规范 公 权 力 机 关 调 取 数 据 的 行为 ,对 大 数据 公司 的 数据 管理 和 第 
三 方 的 数据 调 取 进行 衔接 性 规制 。 


本 书 系 2016 年 国家 社 科 基 金 年 度 项 目 “ 大 数据 时 代 电 子 文件 的 证 据 
规则 与 管理 法 制 建设 研究 ”( 项 目 批准 号 : 16BFX033) 阶 段 性 研究 成 果 。 
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第 一 童 导 论 


第 一 节 背景 介绍 


2015 年 是 我 国 的 大 数据 发 展 元 年 : 8 月 ,国务院 发 布 (促进 大 数据 发 展 
行动 岗 要 ,强调 数据 资源 共享 开放 ;10 月 ,中 国共 产 党 第 十 八 届 中 央 委 员 
会 第 五 次 全 体会 议 上 ,正式 提出 了 国家 大 数据 发 展 战略 。2016 年 3 月 通过 
的 “十 三 五 规划 纲要 ”中 ,再 次 强调 要 实施 国家 大 数据 战略 , 全面 促进 大 数 
据 发 展 行动 。 在 此 背景 下 ,公检法 、 司 部 门 也 开始 全 方位 重视 大 数据 在 
司法 工作 中 的 运用 。 中 央 政 法 委 书 记 孟 建 柱 在 政法 领导 干部 学 习 班 上 曾 
经 强调 “要 善于 运用 大 数据 ,提高 维护 稳定 工作 现代 化 水 平 ";" 最 高 人 民 
检察 院 检察 长 曹 建 明 在 第 十 四 次 全 国 检 察 工作 会 议 上 也 强调 ,要 建设 国家 
检察 大 数据 中 心 ,建立 检 务 大 数据 资源 库 。 ?2 在 司法 实务 中 ,不 少 单位 已 
经 开始 将 大 数据 技术 运用 至 犯罪 侦查 、 办 案 流程 管理 .司法 公开 等 工作 中 
去 。 有 些 司法 机 关 甚 至 已 经 领先 建立 了 智能 化 大 数据 应 用 平台 。 例 如 浙 
江 省 法 院 系统 的 大 数据 平台 ,以 全 省 裁判 文书 为 数据 基础 ,通过 数据 挖掘 
技术 ,对 各 类 案件 特征 ,证 据 运 用 规律 进行 智能 化 挖掘 ;" 泉州 市 丰 泽 区 检 
察 院 建 立 了 “智慧 检察 大 数据 分 析 平 台 ”, 能 够 实现 数据 采集 、 趋 势 研 判 和 
预警 处 置 三 大 功能 ,有 效 地 辅助 了 侦查 决策 ,实现 精准 打击 ;再 如 北京 市 检 


C1] 参见 孟建柱 :《 要 善于 运用 法 治 思维 和 法 治 方式 领导 政法 工作 ), 载 人 民 网 http:// 
politics. people. com. cn/n/2014/0422/c1001-24930131. html,2016 年 9 月 20 日 访问 。 

52] 最 高 检 :《 全 面 实施 电子 检 务 工程 ,打造 智慧 检 务 》,2016 年 7 月 20 日 , 载 正 义 网 
http://www. jcrb. com/xztpd/dk{/201607/dsscgqicgzhy/gzlc/14bs/201607/t20160720 _1635439. 
html, 最 后 访问 时 间 : 2016 年 9 月 20 日 。 

[C3] 参见 :《 司 法 走 进 大 数据 时 代 ,55 岁 是 离婚 诉讼 的 神奇 分 割 线 》, 载 “浙江 在 线 " 网 ,网 址 
http://zjnews. zjol. com. cn/system/2013/11/09/019695246. shtml,2016 年 9 月 20 日 访问 。 
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察 系统 的 “ 检 立 方 ” 大 数据 平台 ,以 该 市 检察 系统 历年 的 上 千 万 项 案件 信息 
为 基础 1 具有 核心 数据 展现 .业务 监督 .专题 分 析 、 检 察 统 计 等 多 项 数据 
分 析 业 务 。 

大 数据 是 人 类 历史 上 的 又 一 次 科学 技术 的 革命 ,在 侦查 领域 ,大 数据 
也 正 开 始 轨 露头 角 , 处 于 探索 运用 阶段 ,具有 巨大 的 潜力 和 广泛 的 应 用 前 
景 。 不 过 可 以 预见 的 是 ,大 数据 侦查 技术 在 推广 运用 的 同时 ,也 必然 会 伴 
随 而 来 诸多 法 律 问题 ,对 传统 侦查 制度 带 来 挑战 。 笔 者 拟 以 大 数据 为 主 
线 , 以 大 数据 技术 在 侦查 领域 已 有 及 未 来 可 能 出 现 的 运用 情况 为 基础 , 提 
出 “大 数据 侦查 ”这 一 概念 ,构建 起 包括 侦查 思维 、 侦 查 模式 、 侦 查 方法 等 完 
整 的 大 数据 侦查 体系 。 与 此 同时 ,对 大 数据 在 侦查 领域 可 能 产生 的 法 律 问 
题 提出 解决 方案 ,构建 大 数据 侦查 的 法 律 程序 和 权利 保障 制度 ,并 构建 起 
数据 共享 ,数据 管理 等 相关 的 配套 机 制 。 


第 二 节 文献 综述 


目前 ,各 个 领域 都 在 强调 发 展 大 数据 战略 。 相 对 于 大 数据 在 互联 网 、 
电子 商务 等 先驱 领域 的 应 用 ,大 数据 在 司法 和 侦查 领域 的 发 展 节奏 相对 慢 
一 些 , 不 过 近 两 年 也 逐渐 呈现 鞍 勃 发 展 之 势 。 笔 者 以 “大 数据 ”与 “侦查 ”为 
关键 词 ,在 超星 中 文学 术 资 源 发 现 平 台 ? 进 行 了 检索 ,对 我 国 “ 大 数据 侦 
查 ” 的 学 术 研 究 状 况 有 大 致 的 了 解 。 根 据 检索 结果 (如 图 1-1 .图 1-2 所 示 )， 
可 知 有 关 大 数据 侦查 的 文献 在 2012 年 之 后 开始 兴起 ,并 呈现 持续 走高 的 
态势 ;这 一 研究 主题 涉及 的 关键 词 主要 有 侦查 工作 、 检 察 机 关 、 职 务 犯罪 、 
数据 采集 .数据 分 析 等 。 


一 、 有 关 大 数据 的 研究 综述 及 评价 
在 展开 具体 的 大 数据 侦查 研究 之 前 ,需要 理解 “大 数据 ?本 身 的 内 涵 、 


5C1] 谢 文 英 :《 北 京 :“ 检 立方 ”吸引 代表 眼光 》, 载 (检察 日 报 》,2014 年 11 月 24 日 ,第 7 版 。 
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图 1-1 以 * 大 数据 "和 * 侦 查 * 为 主题 的 学 术 关键 词 分 布 
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图 1-2 以 “大 数据 "和 “侦查 ”为 主题 的 期 刊 发 展 趋势 
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外 延 及 应 用 原理 等 。 本 文选 取 大 数据 的 概念 ,大 数据 技术 原理 .大 数据 类 
型 .大 数据 的 应 用 以 及 大 数据 发 展 中 所 面临 的 挑战 等 内 容 进 行文 献 梳 理 。 
(一 ) 大 数据 的 概念 
维克托 迈 尔 - 舍 恩 伯 格 (2013) 从 价值 的 角度 对 大 数据 进行 界定 ,强调 


大 数据 侦查 


大 数据 是 从 海量 数据 中 提取 到 价值 和 服务 .522 备 小 峰 (2013) 从 比较 的 角 
度 , 认 为 大 数据 是 海量 的 、 非 结构 化 并 具有 附加 价值 的 数据 5? 作为 权威 
部 门 , 中 国 工信部 (2014) 的 官方 文件 中 则 从 数据 、 结 构 等 特征 去 描述 大 数 
据 , 并 强调 大 数据 不 仅仅 是 静态 的 数据 ,更 是 综合 的 技术 体系 .3 由 此 可 
见 ,目前 学 界 对 于 大 数据 的 概念 并 没有 一 个 盖 棺 论 定 的 界定 ,学 者 们 从 大 
数据 的 特征 或 者 其 价值 等 不 同 角 度 出 发 进行 界定 ,不 过 可 以 肯定 的 是 大 数 
据 的 定义 都 不 仅仅 局 限于 “数据 ?本 身 。 

(二 ) 大 数据 的 技术 原理 

对 大 数据 技术 原理 的 理解 可 以 从 两 个 角度 出 发 ,一 是 纵向 的 大 数据 运 
行 流程 ,二 是 横向 的 大 数据 分 析 技 术 。 从 纵向 的 运用 流程 看 ,工信部 
(2014) 的 官方 文件 将 大 数据 的 运用 过 程 分 为 数据 准备 .数据 存储 与 管理 、 
计算 处 理 . 数 据 分析 和 知识 展现 这 五 个 阶段 .4 孟 小 峰 (2013) 认 为 可 以 将 
其 运用 流程 分 为 数据 选取 、 数 据 集合 .数据 分 析 以 及 数据 解读 这 几 个 阶 
段 。5 实务 中 大 数据 的 运用 一 般 都 遵循 相同 的 流程 ,大 致 可 以 分 为 数据 收 
集 .数据 清洗 .数据 分 析 以 及 数据 可 视 化 呈现 这 几 个 阶段 ,其 中 每 个 阶段 还 
可 以 进行 更 细致 的 划分 。 

从 横向 的 数据 分 析 技 术 看 ,数据 挖掘 是 大 数据 体系 中 最 核心 的 技术 。 
赵刚 (2013) 指 出 ,数据 挖掘 比 大 数据 出 现 得 要 早 , 它 是 大 数据 技术 发 展 的 
前 身 和 基础 。 数 据 挖 掘 是 通过 智能 化 分 析 技 术 , 从 数据 背后 发 掘 出 数据 之 
间 的 模式 和 规律 。 数 据 挖掘 包括 关联 性 分 析 、 聚 类 分 析 、 序 列 分 析 、 异 常 分 
类 等 不 同类 型 ."5 这 些 不 同 的 数据 挖掘 方法 技术 和 侧重 点 各 不 相同 ,它们 


51] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 。 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ,4 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 

52] 孟 小 峰 , 慈 祥 :《 大 数据 管理 : 概念 .技术 和 挑战 》, 载 (计算 机 研究 与 发 展 》,2013(1) 。 

53] 参见 工业 和 信息 化 部 电信 研究 院 :《 大 数据 白皮书 》,2014 年 5 月 ,网 址 http://www. miit. 
gov. cn/n1146312/n1146909/n1146991/n1648536/c3489505/content. html,2016 年 9 月 21 日 访问 。 

54] 参见 工业 和 信息 化 部 电信 研究 院 :《 大 数据 白皮书 》,2014 年 5 月 ,网 址 http://www. miit. 
gov. cn/n1146312/n1146909/n1146991/n1648536/c3489505/content. html,2016 年 9 月 21 日 访问 。 

[C5] 孟 小 峰 , 慈 祥 :《 大 数据 管理 : 概念 ,技术 和 挑战 ), 载 (计算 机 研究 与 发 展 ),2013(1)。 

56] 赵刚 :《 大 数据 一 一 技术 与 应 用 实践 指南 ),150 一 155 页 ,北京 ,电子 工业 出 版 社 ,2013。 


可 以 单独 或 配合 使 用 , 均 发 挥 着 重要 作用 。 可 见 , 无 论 从 技术 还 是 目的 上 
来 说 ,数据 挖掘 技术 已 经 形成 了 大 数据 技术 的 雏形 。 

(三 ) 大 数据 的 运用 模式 

这 里 大 数据 模式 是 指 一 些 普 适 性 的 大 数据 运用 类 型 。 城 田 真琴 
(2013) 从 不 同 角度 对 大 数据 的 运用 模式 进行 了 归纳 。 横 向 角度 ,可 以 从 整 
体 .个 别 、 实 时 、 事 后 四 个 角度 出 发 ,将 大 数据 运用 分 为 四 个 类 型 ; 个 别 优 
化 一 批 处 理 型 ,分 别 优化 一 实时 型 ,整体 优化 一 批 处 理 型 ,整体 优化 一 实时 
型 "1 这 四 种 大 数据 的 运用 模式 在 各 领域 皆 适 用 。 纵 向 角度 来 看 , 城 田 真 
葬 (2013) 还 从 时 间 维 度 将 大 数据 的 运用 模式 归纳 为 “过 去 /现状 的 把 握 
将 来 预测 一 优化 ?这 样 的 一 个 循序 渐进 的 过 程 ,作者 认为 大 数据 运用 的 最 
终 目的 并 不 一 定 是 优化 ,根据 不 同 的 需求 可 以 运用 到 不 同 的 级 别 ,比如 做 
到 ”预测 ”这 一 步 为 止 也 是 可 以 的 。 

(四 ) 大 数据 的 应 用 领域 

相 比 于 对 大 数据 技术 的 抽象 介绍 ,学 者 们 其 实 更 喜欢 描述 大 数据 在 各 
个 领域 的 具体 运用 。 赵 刚 (2013) 介 绍 了 互联 网 .电子 商务 零售 业 、 金 融 
业 、 政 府 、 医 疗 业 、 能 源 业 、 制 造 业 等 领域 对 大 数据 的 个 性 化 需求 ;"” 李 军 
(2014) 介绍 了 大 数据 在 通讯 .医疗 网络. 零售 ` 制 造 . 餐 饮 等 领域 的 运 
用 。?] 钟 瑛 , 张 恒山 (2013) 认 为 大 数据 应 用 有 两 种 类 型 : 一 类 是 专门 提供 
大 数据 技术 的 行业 ,它们 本 身 没 有 数据 源 ; 另 一 类 是 拥有 海量 数据 源 的 行 
业 , 它 们 所 提供 的 主要 是 数据 资源 及 附加 服务 .2 不 过 ,目前 大 数据 在 各 
个 领域 的 发 展 不 是 很 平衡 ,工信部 (2014) 的 官方 文件 认为 目前 全 世界 的 大 
数据 发 展 都 处 于 初级 阶段 ,中 国 的 发 展 落后 于 世界 先进 国家 。 大 数据 在 不 
同 领域 的 发 展 也 不 平衡 ,一 般 来 说 ,网 络 . 金 融 . 电 子 商务 等 领域 的 大 数据 
产业 发 展 较 快 .和 5 
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(五 ) 大 数据 在 发 展 中 所 面临 的 问题 

大 数据 在 发 展 中 首要 面临 的 问题 便 是 技术 上 的 挑战 , 面 对 海量 的 、 非 
结构 化 的 数据 ,采用 何 种 技术 来 存储 处理 一 直 都 是 业界 的 难题 。 工 信 部 
(2014) 的 官方 文件 中 对 此 归纳 得 非常 到 位 ,其 认为 目前 我 国 大 数据 建设 的 
最 严重 问题 一 是 数据 壁垒 数据 孤 岛 现 象 严重 ,各 个 部 门 之 间 的 数据 不 流 
通 ; 二 是 大 数据 本 身 的 存储 清洗 、 分 析 等 相关 技术 发 展 水 平 较 低 .5 孟 小 
峰 (2014) 认 为 ,大 数据 集成 中 面临 着 异 构 性 等 问题 。 除 去 技术 因素 外 ,大 
数据 本 身 也 存在 很 多 风险 .52?2 郑 谢 (2012) 认 为 大 数据 的 算法 、 质 量 、 解 读 
等 有 可 能 出 现 错误 ,会 给 我 们 的 决策 带 来 风险 。 要 警惕 人 为 主观 恶意 对 数 
字 的 操纵 ,警惕 数据 中 存在 的 系统 误差 等 问题 。 另 外 ,大 数据 只 能 告诉 我 
们 数据 背后 的 规律 是 什么 而 非 为 什么 ,人 们 还 应 当 在 此 基础 上 借助 其 他 经 
验 去 探究 背后 的 原因 .3 

另外 ,大 数据 时 代 的 个 人 隐私 还 面临 着 前 所 未 有 的 风险 ,对 数据 价值 
的 利用 、 开 发 必然 会 影响 到 公民 的 隐私 安全 ,并 且 大 数据 对 个 人 隐私 权 的 
侵犯 已 经 突破 了 传统 的 限度 。 维 克 托 。 迈 尔 - 舍 恩 伯 格 (2013) 认 为 ,大 数据 
时 代 要 建立 全 新 的 隐私 保护 方式 ,以 前 是 在 数据 收集 过 程 中 赋予 收集 者 通 
知 及 获取 许可 的 义务 ;而今 数 据 在 收集 之 后 还 会 被 多 次 使 用 ,根本 无 法 预 
知 数据 将 来 的 用 途 。 因 此 传统 的 保护 方法 已 经 过 时 ,应 当 将 隐私 保护 义务 
的 重心 放 在 数据 使 用 环节 .54 实际 上 ,大 数据 利用 与 公民 隐私 权 之 间 的 博 
弈 是 每 个 国家 都 面临 的 问题 , 城 田 真琴 (2013) 介 绍 了 不 同 国家 对 此 问题 的 
回应 方式 一 一 美国 奥巴马 政府 出 台 了 Privacy Bill of Risghts ,对 消费 者 的 
数据 权利 进行 了 全 面 的 保护 ;欧盟 在 2012 年 对 《欧盟 的 数据 保护 指令 》 进 
行 了 修改 ,引入 “被 遗忘 的 权利 ”, 在 没有 明确 征 得 用 户 同意 情况 下 ,禁止 处 
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221 一 223 页 ,杭州 ,浙江 人 民 出 版 社 ,2013。 


理 个 人 数据 ;在 对 日 本 隐私 权 立 法 进行 建议 时 ,作者 提出 “对 集合 匿名 信息 
的 使 用 ”这 一 原则 .5 赵刚 (2013) 提 出 ,可 以 通过 一 些 技术 手段 去 加 强 隐 
私 保护 ,例如 采取 去 个 性 化 技术 、 数 据 脱 敏 技 术 , 使 得 仅 从 数据 本 身 无 法 判 
断 出 数据 主体 的 身份 信息 ,从 而 在 保证 数据 价值 的 同时 也 较 好 地 保护 了 个 
人 隐私 。5?7 

通过 上 述 文献 的 梳理 ,基本 能 够 对 “大 数据 "本身 有 了 初步 的 了 解 , 包 
括 大 数据 的 概念 ,技术 、 运 用 模式 、 应 用 领域 以 及 面临 的 问题 等 内 容 。 了 解 
大 数据 的 目的 是 为 大 数据 侦查 的 叙述 商定 基础 ,大 数据 的 相关 技术 .运用 
模式 及 面临 的 问题 与 大 数据 侦查 体系 的 构建 具有 密切 联系 。 不 过 ,目前 
有 关 大 数据 的 文献 大 都 偏向 于 技术 方法 或 者 实务 应 用 的 介绍 ,而 对 于 大 
数据 的 相关 思维 理念 .配套 机 制 等 偏向 人 文 社 科 领 域 方面 的 研究 尚 涉及 
不 多 。 


二 、 有 关 大 数据 侦查 概念 的 研究 综述 及 评价 


本 书 所 提出 的 “大 数据 侦查 ”这 一 概念 ,具有 一 定 的 开创 性 意义 。 因 
为 ,在 目前 已 有 的 文献 中 ,还 很 少 有 学 者 提出 过 “大 数据 侦查 ”的 概念 。 大 
部 分 学 者 都 是 将 大 数据 作为 研究 背景 或 者 是 一 种 新 的 技术 方法 ,来 探讨 大 
数据 对 侦查 工作 的 影响 。 其 中 ,将 大 数据 作为 研究 背景 的 文献 要 多 一 些 ， 
如 何 军 (2015)537\ 程 宏 (2015). 和 2、 王 晓 楠 (2015)557、 张 俊 岳 (2014) 和 6 都 是 
将 大 数据 作为 新 的 侦查 背景 ,来 将 其 与 传统 的 侦查 模式 进行 比较 研究 。 冯 
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欣 (2015)51 、 急 明 (2015)521. 张 晨 (2015)531、 侯 蹇 (2014) 5 人 等 则 将 大 数据 
作为 新 的 侦查 技术 ,探讨 其 在 侦查 工作 中 的 具体 运用 。 

何 军 (2015) 提 出 “大 数据 驱动 侦查 ”的 概念 ,强调 大 数据 对 传统 侦查 工 
作 所 带 来 的 颠覆 性 变革 ,大 数据 不 仅 能 够 总 结 历史 犯罪 规律 ,还 能 够 在 此 
基础 上 对 未 来 时 空 的 犯罪 活动 进行 预测 .552 张 兆 端 (2014) 提 出 了 * 大 数据 
时 代 的 智慧 警 务 ” 概 念 ,强调 大 数据 及 相关 技术 给 公安 工作 、 警 务工 作 所 带 
来 的 智能 化 变革 .5 张 俊 岳 (2014) 认 为 大 数据 技术 在 侦查 领域 的 运用 是 
大 势 所 趋 的 时 代 潮 流 ,传统 的 信息 化 侦查 为 大 数据 侦查 发 展 提供 了 基 
础 .571 不 过 也 有 个 别 学 者 在 文章 中 提出 过 "大 数据 侦查 ”的 概念 , 李 芍 
(2014) 重 点 从 大 数据 分 析 、 挖 掘 技术 对 侦查 工作 影响 的 角度 去 描述 大 数据 
侦查 的 内 涵 。5 8 

通过 上 述 文献 的 梳理 ,可 见 大 数据 对 侦查 工作 的 影响 已 经 是 势 不 可 
当 , 大 数据 在 侦查 领域 显示 出 前 所 未 有 的 巨大 潜力 。 然 而 , 现 有 文献 对 于 
大 数据 在 侦查 领域 的 研究 仍 过 于 保守 和 片面 ,或 是 将 大 数据 作为 时 代 背 
景 ,而 在 具体 内 容 上 相 较 于 传统 信息 化 侦查 而 言 突 破 并 不 大 ;或 是 将 大 数 
据 作为 一 种 技术 ,从 方法 的 角度 去 介绍 大 数据 对 侦查 工作 的 影响 。 笔 者 认 
为 ,大 数据 本 身 是 思维 方法、 技术 .价值观 的 总 和 ,大 数据 对 于 侦查 领域 的 
影响 也 是 全 面 的 ,不 仅 带 来 侦查 技术 .方法 的 革新 ,更 是 对 侦查 模式 、 侦 查 
思维 以 及 侦查 价值 的 全 面 影响 。 


51] 汉 欣 :《 大 数据 在 盗窃 机 动车 犯罪 侦查 中 的 应 用 》, 载 (中 国 刑警 学 院 学 报 》,2015(3) 。 

[2] 有 括 明 :《 侦 查 讯 问 中 的 大 数据 解读 与 应 用 设想 》, 载 (中 国 刑警 学 院 学 报 》.2015(3) 。 

53] 张 晟 :《 大 数据 打 防 控 多 发 性 盗窃 案件 探析 》, 载 (湖北 警察 学 院 学 报 》,2015(10) 。 

54] 侯 窒 :《 大 数据 时 代 的 反 仙 情 报 收集 与 分 析 》, 载 (山东 警察 学 院 学 报 》,2014(4)。 

55] 何 军 :《 大 数据 与 侦查 模式 变革 研究 ), 载 (中 国人 民 公 安 大 学 学 报 》,2015(1)。 

56] 张 兆 端 :《 智 慧 警 务 : 大 数据 时 代 的 警 务 模 式 》, 载 (公安 研究 ),2014(6) 。 

57] 张 俊 岳 :《 大 数据 背景 下 侦查 工作 的 变革 》, 载 (北京 警察 学 院 学 报 》,2014(4) 。 

58] 李 鞠 :《 大 数据 背景 下 侵 财 犯罪 的 发 展演 变 与 侦查 策略 探析 一 一 以 北京 市 为 样本 ), 载 
《中 国人 民 公安 大 学 学 报 兴 社会 科学 版 ),2014(4) 。 


三 、 有 关 大 数据 技术 在 侦查 领域 运用 的 研究 综述 及 评价 


目前 ,介绍 有 关 大 数据 技术 在 侦查 领域 具体 如 何 运 用 的 文献 相对 较 
多 。 其 中 ,贪污 贿赂 案件 . 侵 财 类 案件 . 丽 怖 犯罪 活动 以 及 金融 证 券 犯 罪 这 
几 类 犯罪 的 侦查 对 大 数据 的 需求 相对 大 一 些 。 另 外 ,一 种 新 的 侦查 模 
式 一 一 预测 型 侦查 ”, 也 随 着 大 数据 技术 的 兴起 而 被 越 来 越 多 的 学 者 所 

(一 ) 在 传统 犯罪 领域 的 运用 

贪污 贿赂 类 犯罪 侦查 。 大 部 分 文献 都 集中 于 强调 大 数据 技术 在 挖掘 
贪污 贿赂 类 犯罪 线索 ,以 及 预测 尚未 发 生 的 贪污 贿赂 类 案件 中 的 作用 。 王 
立 楠 、 魏 佳明 (2015) 认 为 ,应 当 灵 活 运 用 大 数据 的 关联 性 分 析 技 术 , 在 侦查 
初期 就 发 现 贪污 贿赂 犯罪 渎职 犯 罪 等 案件 的 线索 ,1 程 宏 (2015) 认 为 ， 
大 数据 有 利于 发 现职 务 犯 罪 的 “ 黑 数 ”, 通 过 数据 挖掘 技术 可 以 打开 新 的 侦 
查 视野 ,在 其 他 相关 领域 去 发 现 犯罪 线索 ,如 房产 信息 、 政 府 采购 信息 
等 2? 邓 树 刚 (2014) 着 重 强调 大 数据 的 预测 、 预 防 犯罪 功能 ,大 数据 技术 
能 够 提前 预知 职务 犯罪 活动 的 发 生 , 从 而 对 国家 机 关 工 作 人 员 产 生 有 效 的 
监督 。533 

侵 财 类 犯罪 侦查 。 不 少 学 者 提出 运用 大 数据 技术 找 出 侵 财 类 案件 的 
犯罪 规律 ,并 在 此 基础 上 有 的 放 矢 地 制定 侦查 策略 ,以 及 利用 侵 财 犯罪 规 
律 对 未 来 的 犯罪 活动 进行 预测 。 李 获 (2014) 探 讨 了 利用 大 数据 技术 ,总 结 
北京 市 侵 财 犯罪 的 在 地 域 .时空 ,数量 等 维度 的 发 展演 变 规律 ,并 强调 要 根 
据 数 据 分 析 结 果 来 及 时 调整 侦查 战略 的 部 署 工作 。"? 张 蝴 (2015) 探 讨 了 
大 数据 在 多 发 性 盗窃 案件 中 的 运用 ,结合 此 类 案件 人 员 流 动 性 强 的 难题 和 
大 数据 的 技术 特征 ,提出 由 人 到 案 ” 的 大 数据 侦查 模式 ;另外 ,作者 认为 大 


51] 王立 楠 , 魏 佳 明 :《 大 数据 时 代 反 贪 信息 化 侦查 模式 的 构建 ), 载 (中 国 检察 官 ),2015(9) 。 

52] 程 宏 :《 大 数据 背景 下 反 贪 模 式 的 转型 ), 载 (中 国 检察 官 ),2015(2)。 

53] 邓 树 刚 :《 运 用 大 数据 技术 推动 职务 犯罪 预防 工作 》, 载 (人 民 检 察 》,2014(16) 。 

54] 李 鞠 :《 大 数据 背景 下 侵 财 犯罪 的 发 展演 变 与 侦查 策略 探析 一 一 以 北京 市 为 样本 》, 载 
《中 国人 民 公 安 大 学 学 报 》( 社 会 科学 版 ),2014(4)。 


大 数据 侦查 


数据 算法 为 犯罪 预测 提供 了 依据 一 一 借助 已 发 生 的 案件 ,可 以 得 到 概率 ; 
借助 概率 ,可 以 寻求 犯罪 规律 ;借助 犯罪 规律 ,能 够 预测 未 来 犯罪 活动 .和 1 

恐怖 活动 类 犯罪 侦查 。 慌 怖 组 织 犯罪 活动 近 些 年 来 有 扩展 趋势 ,2001 
年 的 "9，117” 秋 〗 怖 袭击 .2015 年 的 巴黎 铠 怖 袭击 等 事件 , 拉 响 了 全 球 的 反 灵 
警报 ,不 少 学 者 开始 探讨 大 数据 在 反 恺 中 的 运用 。 由 于 奴 怖 犯罪 活动 具有 
隐藏 性 ,学 者 们 大 多 探讨 如 何 运 用 数据 挖掘 技术 ,在 犯罪 活动 准备 、 预 备 阶 
段 就 及 时 识别 出 犯罪 线索 及 恐怖 分 子 。 刘 铭 (2015) 提 出 可 以 对 铠 怖 分 子 
的 网 络 行为 特征 建立 数据 模型 ,并 在 互联 网 的 海量 信息 中 进行 数据 挖掘， 
从 而 识别 具有 慌 怖 嫌疑 的 人 员 。' ?2 梅 建明 (2007) 从 美国 的 反 铠 项 目 中 总 
结 数据 挖掘 的 作用 ,并 建议 我 国 实 施 反 恐 大 数据 挖掘 的 计划 。."? 侯 害 
(2014) 探 讨 了 大 数据 在 反 怒 情 报 收集 与 分 析 中 的 运用 ,提出 从 “数据 化 ”的 
原理 出 发 ,对 反恐 数据 进行 多 点 搜集 .立体 化 搜集 ,注重 对 丽 怖 分 子 网 络 通 
讯 数据 的 挖掘 。") 

通过 对 上 述 文献 的 梳理 ,我 们 大 致 了 解 了 大 数据 在 犯罪 侦查 中 的 具体 
运用 情景 及 运用 方式 。 尽 管 只 介绍 了 大 数据 技术 在 上 述 几 类 案件 侦查 中 
的 运用 ,但 是 我 们 可 以 举一反三 ,将 一 些 可 行 的 大 数据 侦查 方法 推广 至 其 
他 案件 中 去 。 不 过 ,目前 相关 文献 对 于 大 数据 侦查 方法 的 介绍 往往 依赖 于 
具体 的 犯罪 场景 , 尚 还 很 少 有 学 者 总 结 、 归 纳 出 一 些 普 适 的 大 数据 侦查 方 
法 及 侦查 模式 。 因 此 ,对 一 些 重要 的 、 常 用 的 大 数据 侦查 方法 进行 归纳 也 
是 本 文 拟 研究 的 重点 内 容 。 

(二 ) 在 犯罪 预测 中 的 运用 

除了 在 具体 个 案 侦查 中 运用 外 ,大 数据 侦查 还 有 一 类 重要 的 运用 -一 
预测 犯罪 活动 的 发 生 。 大 数据 本 身 最 重要 的 价值 就 在 于 预测 ,这 一 功能 在 
侦查 领域 当然 也 会 有 所 体现 。 尽 管 预 测 犯 罪 现 在 听 起 来 还 带 有 一 些 科 幻 


51] 张 蝴 :《 大 数据 打 防 控 多 发 性 盗窃 案件 探析 》, 载 (湖北 警察 学 院 学 报 》,2015(10)。 
52] 刘 铭 :《 大 数据 反 届 应 用 中 的 法 律 问题 分 析 ), 载 (河北 法 学 》,2015(2) 。 

C3] 梅 建明 :《 论 反恐 数据 挖掘 》, 载 (中 国人 民 公安 大 学 学 报 兴 社会 科学 版 ) ,2007(2) 。 
54] 侯 需 :《 大 数据 时 代 的 反 恺 情报 收集 与 分 析 》, 载 (山东 警察 学 院 学报 》,2014(4) 。 


色彩 ,但 这 已 经 不 再 是 遥 不 可 及 之 事 , 理 论 界 也 越 来 越 多 的 学 者 开始 关注 
大 数据 的 预测 犯罪 功能 。 

吕 雪 梅 (2015) 介 绍 了 美国 的 “预测 警 务 ” 制 度 ,其 认为 预测 警 务 的 关键 
就 在 于 大 数据 技术 的 运用 ,通过 数据 挖掘 技术 归纳 出 各 种 犯罪 的 数据 模 
型 ,并 用 于 对 未 来 犯罪 的 预测 .17 汉 冠 筹 (2014) 则 对 我 国 预测 警 务 的 运用 
进行 了 展望 性 的 设计 ,将 其 分 为 国家 安全 预测 .维稳 态势 预测 .治安 形势 预 
测 .社会 管理 预测 .民意 向 导 预 测 以 及 民生 服务 预测 六 个 领域 .2 

犯罪 热点 分 析 是 大 数据 预测 型 侦查 的 核心 内 容 。 吕 雪 梅 (2015) 指 出 
美国 当前 的 犯罪 情报 分 析 中 ,融合 了 “热点 成 像 ? 和 “地 理 画 像 ” 技 术 的 达 
80% 的 比例 ." 陈 鹏 等 (2012) 从 专业 角度 提出 了 犯罪 热点 的 识别 和 分 析 
方法 间 炊 军 等 (2013) 结 合 侦查 实务 中 具体 的 犯罪 预测 工具 “犯罪 预测 
时 空 定位 信息 管理 系统 V1. 0”, 来 对 犯罪 的 时 间 热 点 和 空间 热点 进行 研 
究 , 在 此 基础 上 可 以 获得 犯罪 在 时 间 和 空间 上 所 呈现 的 规律 ,将 现实 中 一 
些 动态 的 因素 与 之 相 结合 , 便 能 够 得 到 预测 犯罪 发 生 的 数学 模型 .551 陆 娟 
等 (2012) 将 犯罪 热点 总 结 为 热点 地 区 ,热点 时 段 、 热 点 类 型 .热点 目标 几 个 
方面 ,并 基于 专业 角度 提出 了 犯罪 热点 的 识别 方式 .55 

尽管 实务 中 仍然 有 很 多 人 对 大 数据 的 预测 犯罪 功能 持 怀疑 态度 ,但 通 
过 上 述 的 文献 梳理 可 以 发 现 ,预测 犯罪 从 技术 上 来 说 是 完全 可 行 的 。 不 
过 ,目前 此 方面 的 文章 多 集中 于 专业 预测 技术 介绍 , 尚 缺 乏 相关 法 律 理论 
的 介绍 ,容易 造成 技术 与 实践 运用 脱节 的 现象 。 实 际 上 ,犯罪 预测 并 非 是 
完全 新 鲜 的 事物 ,传统 犯罪 学 中 也 有 犯罪 预测 的 相关 理论 ,不 过 大 数据 时 
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学 版 ) ,2012(3) 。 

55] 闪耀 军 , 张 明 :《 犯 罪 预测 时 空 定 位 信息 管理 系统 的 构建 》, 载 (中 国人 民 公安 大 学 学 报 》 
(社会 科学 版 ) ,2013(4) 。 

56] 陆 娟 等 :《 犯 罪 热 点 时 空 分 布 研 究 方法 综述 》, 载 (地 理科 学 进展 》,2012(4) 。 


大 数据 侦查 


代 的 预测 犯罪 又 有 了 新 的 技术 和 内 涵 。 因 此 ,笔者 拟 将 传统 的 犯罪 预测 理 
论 与 现代 的 大 数据 预测 技术 相 结合 , 提出 预测 型 大 数据 侦查 模式 ,探讨 犯 
罪 预测 在 大 数据 时 代 的 新 内 涵 。 


四 、 有 关 大 数据 侦查 与 传统 侦查 相 比较 的 研究 综述 及 评价 


上 述 文献 主要 是 从 具体 的 、 微 观 的 层面 去 探讨 大 数据 侦查 技术 、 方 法 
的 运用 。 从 抽象 的 .宏观 的 层面 看 ,大 数据 侦查 对 传统 的 侦查 模式 、 侦 查 思 
维 也 会 带 来 突破 性 影响 。 

(一 ) 大 数据 侦查 对 传统 侦查 模式 的 突破 

何 军 (2015) 提 出 “大 数据 驱动 侦查 ”的 概念 ,认为 其 是 一 种 全 新 的 侦查 
模式 ,体现 出 数据 共享 的 一 体 性 特征 ,是 一 种 由 点 到 面 的 全 景 式 侦查 、 预 知 
未 来 的 预测 型 侦查 以 及 利用 数据 模型 的 算法 型 侦查 。 相 对 于 传统 侦查 而 
言 , 这 一 新 型 侦查 模式 能 够 更 全 面 地 获取 信息 ,能 够 更 深入 地 分 析 研 判 信 
息 。22 张 俊 岳 (2014) 指 出 ,大 数据 改变 了 传统 ”口供 为 王 ” 的 侦查 模式 ,更 
多 地 依赖 以 数据 为 中 心 的 侦查 技术 :大 数据 改变 了 过 去 由 案 到 人 的 侦查 模 
式 , 转 向 “由 数据 到 案由 数据 到 人 ”的 侦查 模式 ."?? 王 晓 楠 (2015) 指 出 大 
数据 将 促进 侦查 模式 由 反应 型 侦查 向 主动 型 侦查 转变 ,并 且 大 数据 的 预测 
功能 将 促进 主动 型 侦查 模式 进一步 朝 着 纵深 方向 发 展 ;大 数据 的 关联 性 分 
析 、 碰 撞 等 功能 能 提前 预测 犯罪 活动 的 发 生 。"”) 

(二 ) 大 数据 侦查 对 传统 侦查 思维 的 突破 

何 军 (2015) 认 为 在 大 数据 时 代 , 应 当 确 立 在 线 、 开 放 的 数据 共享 侦查 
理念 ;数据 主导 侦查 的 理念 ,依据 数据 分 析 结 果 来 采取 侦查 措施 ;相关 性 理 
念 ,善于 利用 大 数据 的 相关 性 分 析 功 能 ; 线 上 与 线 下 相 结 合 的 理念 ,强调 数 
据 逻 辑 与 人 类 经 验 ,法律 规 定 的 互补 .2 


51] 何 军 :《 大 数据 与 侦查 模式 变革 研究 ), 载 (中 国人 民 公安 大 学 学 报 )》,2015(1) 。 
52] 张 俊 岳 :《 大 数据 背景 下 侦查 工作 的 变革 》, 载 (北京 警察 学 院 学 报 》,.2014(4) 。 
53] 王 晓 楠 :《 大 数据 时 代 下 的 主动 型 侦查 模式 研究 ), 载 (辽宁 警 专 学 院 学 报 》,2015(3) 。 
54] 何 军 :《 大 数据 与 侦查 模式 变革 研究 ), 载 (中 国人 民 公 安 大 学 学 报 》,2015(1) 。 


马 忠 红 (2011) 认 为 人 类 社会 的 技术 变革 也 必 将 引起 侦查 思维 方式 的 
变革 。 信 息 时 代 应 当 以 “信息 ”作为 侦查 思维 的 起 点 ,侦查 人 员 要 培养 发 散 
性 ,立体 化 ,智能 化 、 多 维度 的 理念 。 作 者 还 提出 了 信息 时 代 侦 查 思 维 在 时 
间 、 空 间 、 人 、 物 等 方面 的 转变 要 点 。'17 

(三 ) 大 数据 侦查 对 传统 侦查 理念 的 突破 

机 永生 (2013) 提 出 了 大 数据 视野 下 犯罪 现场 概念 ,他 认为 在 大 数据 视 
野 下 ,犯罪 现场 要 延伸 至 数据 空间 ,尤其 要 注意 一 些 表 面 上 看 起 来 与 案件 
及 犯罪 嫌疑 人 无 关 的 数据 ,这 些 看 似 无 关 的 数据 背后 往往 蕴藏 着 重要 的 破 
案 信息 。22 

另外 ,还 有 学 者 讨论 了 大 数据 对 于 传统 犯罪 心理 画像 .犯罪 情报 等 传 
统 侦查 概念 的 影响 。 赖 继 (2015) 认 为 ,在 大 数据 时 代 , 犯 罪 心理 画像 可 以 
借助 基础 数据 平台 和 标签 卡 的 方法 ,进行 智能 化 数据 画像 。 ?2 陶 雨 (2015) 
认为 大 数据 会 对 传统 的 侦查 情报 收集 及 分 析 产 生 影响 ,大 数据 能 够 扩展 侦 
查 情报 的 来 源 , 提 高 侦查 情报 的 研判 能 力 。 7 

上 述 的 文献 从 不 同 角度 回应 了 大 数据 侦查 将 带 来 的 侦查 模式 .思维 等 
一 系列 宏观 层面 的 变革 。 每 个 作者 都 是 基于 其 本 身 的 研究 旨 趣 和 学 科 背 
景 来 展开 研究 ,不 可 能 面面俱到 ,况且 对 于 大 数据 侦查 本 身 而 言 也 没有 绝 
对 的 统一 研究 范式 。 不 过 ,在 宏观 ,抽象 层面 上 ,目前 学 界 大 多 基于 比较 的 
视角 ,将 大 数据 侦查 与 传统 侦查 进行 对 比 ,对 大 数据 侦查 的 模式 方法、 思 
维 等 进行 研究 。 在 侦查 模式 上 ,大 部 分 学 者 都 将 “数据 ?作为 切入 点 ,建立 
从 数据 到 人 、 从 数据 到 案 的 侦查 模式 ;强调 大 数据 的 “预测 ”功能 对 犯罪 侦 
查 模式 在 时 间 维 度 上 所 带 来 的 改变 。 在 侦查 思维 上 ,学 者 们 从 大 数据 本 身 


[1] 马 忠 红 :《 信 息 化 时 代 侦 查 思维 方式 之 变革 ), 载 (中 国人 民 公 安 大 学 学 报 )( 社 会 科学 
版 ),2011(1)。 尽 管 本 文中 没有 提 到 “大 数据 ”, 在 当年 大 数据 也 还 没有 兴起 ,但 是 作者 在 这 篇 文章 
中 的 理念 与 当前 的 大 数据 思维 不 谋 而 合 ,有 很 多 值得 借鉴 之 处 。 

C52] 机 永生 :《 大 数据 视野 下 犯罪 现场 概念 及 其 应 用 探讨 ), 载 (政法 学 刊 ),2013(4)。 

53] 赖 继 :《 犯 罪 心 理 画 像 : 原理 再 解读 .标签 卡 与 大 数据 前 景 ), 载 ( 四 川 警察 学 院 学 报 》， 
2015(3) 。 

54] 陶 雨 :《“ 大 数据 ” 视 域 下 侦查 情报 变革 及 完善 微 探 》, 载 (法 制 博 览 ),2016(6)。 
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的 “全 数据 “混杂 性 ”以 及 “相关 性 ”三 个 基本 特征 出 发 ,衍生 出 大 数据 侦查 
的 思维 模式 ,其 中 尤其 以 “相关 性 ”思维 为 重点 一 一 通过 大 数据 的 相关 性 思 
维 模 式 来 改变 传统 的 因果 关系 思维 模式 ,在 此 基础 上 发 现 更 多 的 犯罪 线 
索 , 提 高 侦查 的 效率 。 此 外 ,还 有 很 多 诞生 于 传统 侦查 语 境 下 的 概念 在 大 
数据 时 代 都 有 了 新 的 定义 ,如 犯罪 现场 ,犯罪 心理 画像 ,等 等 。 


五 、 有关 大 数据 侦查 所 存在 问题 及 回应 的 研究 综述 及 评价 


大 数据 在 带 来 侦查 技术 变革 、 进 步 的 同时 ,也 会 带 来 一 系列 的 问题 。 
有 些 问题 是 缘 于 大 数据 本 身 ,例如 大 数据 对 隐私 权 的 冲击 在 各 个 领域 都 不 
可 避免 有些 问 题 则 是 大 数据 这 一 中 立 技 术 在 法 律 领域 所 特有 的 不 适 
反应 。 

(一 ) 技术 方面 的 问题 及 回应 

大 数据 侦查 在 技术 方面 所 面临 的 问题 大 多 缘 于 大 数据 本 身 的 技术 特 
征 。 张 兆 端 (2014) 指 出 目前 大 数据 侦查 技术 体系 建设 中 还 面临 着 标准 体 
系 缺乏 、 忽 视 数据 质量 等 问题 .和 1 吕 雪 梅 (2015) 强 调 要 设计 犯罪 特征 算法 
模型 ,大 力 发 展 数据 挖掘 技术 .'* 冯 冠 筹 (2014) 强 调 要 构建 集 数据 存储 、 
处 理 、 分 析 于 一 体 的 警 务 中 心 。53? 

(二 ) 机 制 方面 的 问题 及 回应 

在 大 数据 侦查 的 机 制 建设 方面 ,目前 最 大 的 问题 就 是 各 个 部 门 之 间 的 
数据 壁垒 ,数据 之 间 不 能 共享 .开放 ,海量 的 数据 资源 就 无 法 被 盘活 。 吕 雪 
梅 (2015) 强 调 要 推动 政府 数据 及 社会 数据 的 开放 ,注重 数据 质量 .5 张 俊 
岳 (2014) 强 调 要 促进 各 级 侦查 机 关 之 间 的 数据 共享 机 制 , 规 范 数据 使 用 分 
配 权限 ,对 数据 运用 进行 全 面 记 录 。'5) 


51] 张 焰 端 : 《智慧 警 务 : 大 数据 时 代 的 警 务 模 式 》, 载 (公安 研究 ),2014(6) 。 

52] 虽 雪 梅 :《 美 国 预测 警 务 中 基于 大 数据 的 犯罪 情报 分 析 》, 载 (情报 杂志 》,2015(12)。 
53] 冯 冠 筹 :《 大 数据 时 代 实 施 预测 警 务 探究 ) , 载 (广东 公安 科技 》,2014(1) 。 

54] 吕 雪 梅 :《 美 国 预测 警 务 中 基于 大 数据 的 犯罪 情报 分 析 》, 载 (情报 杂志 》,2015(12)。 
55] 张 俊 岳 :《 大 数据 背景 下 侦查 工作 的 变革 》, 载 (北京 警察 学 院 学 报 》,2014(4) 。 


(三 ) 权利 方面 的 问题 及 回应 

隐私 权 是 大 数据 侦查 所 面临 的 最 重要 问题 之 一 ,几乎 所 有 学 者 都 提 到 
在 侦查 中 大 数据 技术 的 运用 会 对 公民 的 隐私 权 带 来 前 所 未 有 的 威胁 。 赵 
峰 等 (2015) 认 为 大 数据 侦查 会 对 公民 的 “信息 自决 权 ” 造 成 侵犯 ,尽管 在 刑 
事 侦查 中 公民 的 个 人 信息 权 需 要 做 出 一 些 让 步 , 但 并 非 是 无 限度 的 。 作 者 
还 提出 在 侦查 过 程 中 对 涉及 信息 自决 权 的 事项 实施 审批 机 制 ,以 及 引入 独 
立 的 第 三 方 对 信息 自决 权 进 行 评估 等 51 吕 雪 梅 (2015 ) 提 出 在 侦查 机 关 
收集 .分 析 个 人 数据 时 ,应 遵守 公开 原则 、 收 集 限 制 原 则 .个 人 参与 原则 
等 .521 刘 铭 (2015) 指 出 ,在 反恐 中 的 大 数据 应 用 必 将 涉及 公民 的 个 人 信 
息 ,从 而 会 造成 对 公民 隐私 权 的 侵害 .3 在 美国 ,很 多 学 者 提出 “大 数据 监 
控 ” 的 概念 (big data surveillance) ,通过 新 型 的 数据 采集 技术 ,对 公民 的 各 
项 数据 进行 收集 ,实现 全 方位 监控 。 现 在 政府 有 能 力 收集 、 分 析 与 个 人 有 
关 的 几乎 所 有 数据 ,各 种 数据 库 、 监 控 系 统 的 建立 就 是 “大 数据 监控 ”的 最 
好 体现 。Miller Kevin(2014) 认 为 ,大 数据 对 公民 隐私 权 的 侵犯 是 一 种 “从 
质 到 量 ” 的 变化 ,传统 的 隐私 权 关 注 对 公民 物理 空间 和 私生活 的 侵犯 ,这 是 
一 种 “ 质 ” 的 侵犯 模式 ;而 大 数据 则 是 通过 一 个 个 信息 碎片 组 成 海量 的 数据 
库 , 这 些 数据 的 单独 使 用 都 是 合法 的 、 无 关 隐 私 的 ,但 是 聚集 起 来 进行 再 次 
分 析 后 则 会 对 个 人 隐私 带 来 侵犯 ,这 也 是 传统 隐私 法 无 法 规制 的 .543 

除了 隐私 权 之 外 ,大 数据 侦查 对 传统 刑事 诉讼 中 的 一 些 程序 性 权利 、 
法 律 原理 也 会 带 来 影响 。 王 晓 楠 (2015) 和 维克托 。 迈 尔 - 舍 恩 伯 格 (2013) 
认为 ,大 数据 侦查 涉及 对 未 发 生 犯 罪 的 处 罚 ,嫌疑 人 所 遭受 的 惩罚 来 源 于 


C1] 赵峰 , 俞 私 瑶 , 王 金成 :《 现 代 侦查 行为 中 * 大 数据 ”的 应 用 风险 研究 一 一 以 信息 自决 权 为 
视角 》, 载 4 法制 博 览 》,2015(11) 。 

52] 吕 雪 梅 :《 美 国 预测 警 务 中 基于 大 数据 的 犯罪 情报 分 析 》, 载 (情报 杂志 》,2015(12)。 

53] 刘 铭 :《 大 数据 反恐 应 用 中 的 法 律 问题 分 析 》, 载 (河北 法 学 ),2015(2) 。 

[4] See Miller, Kevin,“Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacy’s Perfect Storm” ,Journal of Technology Law & Policy,1(2014) ,pp. 105-146. 
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未 实施 的 行为 ,不 利于 人 权 保 障 ,违背 了 无 罪 推定 原则 .522 梅 建明 (2007) 
则 担忧 数据 挖掘 技术 所 产生 的 错误 ,并 由 此 而 带 来 的 “ 错 判 ”风险 ,有 可 能 
放 走 坏人 , 也 有 可 能 冤枉 无 就 者 , 因此 要 提高 数据 挖掘 的 准确 度 。5?) 
Miller Kevin(2014) 指 出 ,大 数据 侦查 中 不 可 避免 地 带 有 人 为 主观 偏见 ,从 
数据 的 收集 、 数 据 算法 的 设计 到 数据 结果 的 执行 ,每 一 环节 都 离 不 开 人 为 
的 操作 ,每 个 环节 也 都 不 可 避免 地 带 有 人 为 主观 偏见 的 影响 。 侦 查 执 行 环 
节 , 这 些 早期 环节 的 人 为 价值 偏见 会 在 执行 中 被 放大 .53?] 在 美国 ,很 多 学 
者 认为 大 数据 侦查 侵犯 了 宪法 第 五 修正 案 所 保护 的 正当 程序 权利 (due 
process) ,这 主要 源 于 大 数据 侦查 过 程 的 不 透明 。 大 数据 系统 是 一 个 “暗箱 
操作 ”(black box) 的 过 程 , 人 们 只 看 到 数据 的 输入 和 输出 结果 ,而 对 其 中 间 
的 运算 过 程 却 一 无 所 知 。 在 此 过 程 中 ,公民 的 正当 程序 权 无 法 得 到 保障 。 

通过 对 上 述 文献 的 梳理 ,我 们 大 致 可 以 了 解 大 数据 侦查 目前 所 面临 的 
技术 、 机 制 及 权利 方面 的 问题 。 大 数据 侦查 是 一 个 复杂 的 体系 ,技术 上 的 
攻克 仅仅 是 基础 环节 ,各 部 门 之 间 的 数据 开放 共享 以 及 大 数据 专业 人 才 队 
伍 的 建设 是 各 侦查 机 关 都 需要 面 对 的 配套 机 制 问题 。 另 外 ,大 数据 侦查 必 
然 会 对 传统 法 律 程序 ,法律 权利 带 来 冲击 和 影响 。 无 论 是 对 公民 的 隐私 
权 , 还 是 传统 的 正当 程序 价值 .公平 正义 价值 ,大 数据 技术 都 显示 出 巨大 的 
威慑 力 。 因 而 ,必须 通过 法 律 手段 对 大 数据 侦查 进行 规制 ,否则 会 给 社会 
秩序 及 公平 正义 带 来 不 利 影响 ,有 违 大 数据 的 伦理 要 求 。 不 过 上 述 文献 对 
于 这 些 问题 的 研究 也 并 非 面面俱到 。 例 如 大 部 分 学 者 都 提 到 了 隐私 权 问 题 ， 
但 是 大 数据 时 代 的 隐私 权 不 同 于 传统 的 隐私 权 , 其 更 强调 一 种 动态 的 权利 机 
制 ,传统 的 隐私 权 保护 方式 已 经 不 再 适应 大 数据 时 代 的 隐私 权 , 并 且 大 部 分 
学 者 对 于 如 何 协调 隐私 权 与 侦查 权 之 间 的 关系 并 没有 给 出 明晰 的 对 策 。 
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第 三 节 创新 及 意义 


一 、 创新 之 处 


本 书 力求 在 传统 的 物理 侦查 空间 之 外 ,开辟 出 新 的 虚拟 数据 空间 和 数 
据 侦查 方法 ,以 弥补 传统 侦查 的 不 足 和 短 板 之 处 。 传 统 的 侦查 大 都 局 限于 
物理 空间 ,侦查 措施 的 展开 只 能 依托 于 物理 载体 ,所 获取 的 信息 也 是 有 限 
的 。 大 数据 时 代 则 创造 出 一 个 与 物理 空间 完全 相对 的 数据 空间 ,任何 人 的 
一 举 一 动 在 数据 空间 都 有 着 对 应 的 数据 痕迹 ;数据 空间 甚至 能 够 提供 很 多 
物理 空间 无 法 感应 的 信息 ,如 物 的 状态 .人 的 睡眠 、 健 康 等 数据 。 数 据 空 间 
无 疑 也 为 侦查 提供 了 一 个 新 的 领域 。 本 书 正 是 基于 此 提出 “大 数据 侦查 ” 
主题 ,探讨 在 大 数据 空间 开展 侦查 的 可 行 性 ,并 分 析 大 数据 对 侦查 思维 、 侦 
查 模式 、 侦 查 方法 以 及 相关 侦查 制度 带 来 的 一 系列 变革 。 以 期 本 研究 能 够 
开拓 新 的 侦查 空间 和 侦查 方法 ,弥补 传统 侦查 在 技术 、 方 法 上 的 不 足 ,为 侦 
查 领域 注入 新 的 发 展 动力 。 概 言 之 ,本 书 具 有 以 下 创新 之 处 。 

(1) 提出 “大 数据 侦查 ”这 一 新 的 概念 。 传 统 侦查 的 概念 一 般 指 立案 之 
后 的 侦查 工作 ,但 是 本 文 认为 立案 前 的 预测 型 侦查 却 是 大 数据 侦查 的 应 有 
之 义 ,因而 如 何 协调 传统 侦查 概念 与 大 数据 侦查 概念 之 间 的 冲突 是 个 难 
点 。 笔 者 思路 是 拓展 传统 侦查 的 范畴 ,构建 广义 上 的 “大 数据 侦查 ”概念 。 
在 此 基础 上 ,对 大 数据 侦查 与 信息 化 侦查 等 概念 之 间 进 行 辨析 。 

(2) 构建 完整 的 大 数据 侦查 体系 。 目 前 ,大 数据 侦查 在 我 国 处 于 初 
步 发 展 阶段 ,相关 的 技术 、 方 法 尚 处 于 探索 中 ,实务 中 的 运用 也 呈 和 零散 混 
乱 的 状态 。 本 书 在 提出 “大 数据 侦查 概念 ”的 基础 上 ,进一步 将 这 些 纷繁 
复杂 的 大 数据 侦查 技术 ,方法 进行 整合 ,从 大 数据 侦查 的 具体 实务 运用 中 
提炼 出 抽象 的 、 普 适 的 侦查 模式 及 侦查 思维 。 构 建 清晰 ,完整 的 大 数据 侦 
查 体系 ,为 实务 中 大 数据 侦查 的 具体 方法 和 运用 情境 的 选择 及 判断 提供 
指导 。 

(3) 回应 大 数据 侦查 中 所 存在 的 问题 。 大 数据 侦查 技术 不 可 避免 地 会 
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对 传统 的 侦查 理论 、 侦 查 程序 带 来 一 系列 冲击 。 例 如 大 数据 分 析 过 程 的 不 
透明 与 正当 程序 原则 之 间 的 冲突 ,大 数据 相关 性 规则 对 司法 证 明 原 理 产 生 
的 影响 ,大 数据 挖掘 与 个 人 信息 权 . 个 人 隐私 权 之 间 的 冲突 等 。 鉴 于 目前 
大 数据 侦查 尚 处 于 探索 阶段 ,很 多 问题 都 未 真正 凸显 ,如 何 发 现 并 回应 这 
些 冲 突 也 是 本 书 的 创新 点 之 一 。 在 提出 这 些 问题 的 同时 ,笔者 也 在 现 有 的 
法 律 框架 内 对 大 数据 侦查 的 程序 规制 提出 相关 建议 。 

(4) 将 大 数据 侦查 制度 的 构建 与 大 数据 本 身 的 特征 相 融 合 。 在 大 数 
据 侦 查 制 度 的 构建 过 程 中 ,数据 作为 主体 , 必 不 可 免 地 要 涉及 有 关 大 数据 
本 身 的 相关 技术 、 机 制 , 如 何 将 其 与 现 有 的 侦查 制度 相 结合 、 成 为 具有 特 
色 的 大 数据 侦查 制度 ,也 是 本 书 的 创新 点 之 一 。 例 如 提出 的 要 构建 大 数 
据 侦查 共享 机 制 ,就 建立 在 数据 共享 基础 之 上 ,强调 侦查 机 关内 部 的 数据 
共享 以 及 侦查 机 关 与 社会 行业 的 数据 共享 ,并 建立 与 之 相对 应 的 侦查 
体制 。 


二 、 研究 意义 


本 书 将 具有 以 下 的 理论 和 实践 意义 。 

一 是 为 大 数据 侦查 的 理论 研究 提供 创新 性 观点 。 目 前 ,我 国有 关 大 数 
据 侦查 的 大 部 分 文献 是 从 技术 角度 对 大 数据 在 侦查 中 的 运用 进行 介绍 ,对 
大 数据 侦查 理论 层面 研究 的 深度 还 不 够 (如 侦查 思维 、 侦 查 模 式 等 )。 尽 管 
也 有 一 些 文章 涉及 对 大 数据 侦查 相关 理论 的 介绍 ,不 过 它们 大 多 没有 脱离 
大 数据 本 身 的 理论 范畴 ,抑或 只 是 从 传统 侦查 理论 出 发 进行 浅 尝 辑 止 的 分 
析 ,很 少 有 文章 能 够 将 大 数据 理论 和 侦查 理论 进行 完美 契合 。 而 笔者 认 
为 ,恰恰 这 两 个 领域 的 理论 融合 才 是 大 数据 侦查 的 理论 精髓 所 在 。 因 而 ， 
本 书 拟 尝 试 对 大 数据 理论 和 侦查 理论 的 冲突 和 衔接 进行 探讨 ,在 传统 法 律 
的 框架 下 提出 创新 性 的 理论 观点 。 

二 是 为 大 数据 侦查 的 实务 运用 提供 指导 。 从 技术 角度 来 说 ,大 数据 侦 
查 是 科学 技术 、 方 法 的 运用 ;从 法 律 角 度 来 看 ,大 数据 侦查 是 侦查 程序 的 组 
成 部 分 ,理应 遵守 相关 的 法 律 程序 规制 。 大 数据 在 带 来 侦查 技术 、 方 法 革 


新 的 同时 ,也 会 对 传统 的 侦查 理论 .诉讼 程序 以 及 法 律 制度 带 来 影响 。 尤 
其 是 目前 大 数据 热 的 社会 环境 中 ,容易 陷入 “ 唯 大 数据 论 ” 的 误区 。 如 果 不 
对 大 数据 侦查 进行 法 律 程序 上 的 规制 , 则 很 有 可 能 对 当事人 的 相关 利益 、 
正当 程序 造成 侵害 。 因 而 ,本 文 拟 探 讨 大 数据 侦查 可 能 带 来 的 法 律 问题 ， 
并 提出 相关 的 程序 .制度 上 的 规制 建议 ,为 我 国 大 数据 侦查 的 法 治 化 发 展 
提供 指导 性 规则 。 
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大 数据 在 我 国 的 兴起 不 过 短 短 两 三 年 光景 “大 数据 侦查 ”并非 是 个 约 
定 俗 成 的 ,标准 的 法 律 术 语 。 笔 者 结合 大 数据 特征 以 及 大 数据 在 侦查 中 运 
用 情况 ,开创 性 地 提出 “大 数据 侦查 ”这 一 新 概念 。 从 字面 上 看 ,“ 大 数据 侦 
查 ” 是 由 “大 数据 ”和 "侦查 ”两 个 词语 组 成 的 ,本 章 通过 对 大 数据 的 介绍 ,并 
结合 传统 侦查 的 基本 原理 ,来 界定 阐述 “大 数据 侦查 ”的 含义 。 
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一 、 大 数据 的 沿革 与 发 展 


(一 ) 大 数据 的 沿革 

对 于 今天 社会 来 说 “大 数据 ?已 不 再 是 陌生 的 词汇 ,甚至 可 以 称 为 
时 下 最 流行 的 词汇 之 一 。 各 行 各 业 似 乎 都 能 看 到 大 数据 的 身影 ,从 较 
早 的 互联 网 .电子 商务 等 领域 到 现在 的 政务 系统 .医疗 系统 等 各 行业 都 
在 强调 大 数据 的 运用 ,甚至 连 学 术 研 究 都 要 开始 倡导 大 数据 方法 .“ 大 
数据 ?一 词 从 出 现 到 普及 不 过 短 短 几 年 光景 ,那么 ,大 数据 究竟 从 何 而 
来 呢 ? 

首先 ,大 数据 的 发 展 得 益 于 海量 数据 的 累积 。 大 数据 早期 的 形态 可 以 
追溯 至 20 世纪 末 、21 世纪 初 互联 网 的 普及 时 期 ,这 一 时 期 为 大 数据 的 发 展 
积累 了 丰厚 的 数据 资源 。 随 着 互联 网 、 计 算 机 技术 的 发 展 , 人 们 的 工作 、 生 
活 等 逐渐 延伸 至 虚拟 空间 。 尤 其 是 随 着 Web 2.0 时 代 的 到 来 ,社交 网 络 、 
电子 商务 平台 、 自 媒体 以 及 智能 手机 的 兴起 ,人 们 开始 在 网 络 上 留 下 大 量 
数据 痕迹 。 在 这 一 阶段 ,数据 呈现 出 海量 爆发 式 增 长 。 纵 观 我 们 的 日 常生 
活 , 手 机 记录 了 我 们 的 地 理 位 置 数据 .信用 卡 记录 下 我 们 的 消费 数据 .电子 
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病历 记录 下 我 们 的 健康 数据 ,等 等 。 几 乎 我 们 工作 .生活 中 一 举 一 动 都 被 
数据 记录 下 来 .1 这 些 海量 的 原始 数据 构成 了 大 数据 的 雏形 ,为 大 数据 的 
发 展 提供 了 原始 材料 。 

其 次 ,大 数据 的 发 展 还 得 益 于 数据 存储 和 数据 管理 技术 的 革新 。 在 这 
方面 较 早 试 水 的 主要 是 美国 的 一 些 互联 网 企业 ,如 谷歌 .IBM、 亚 马 孙 等 公 
司 。 促 进 大 数据 产生 的 技术 有 以 下 几 方 面 : 数据 存储 技术 。 计 算 机 领域 
有 一 个 “摩尔 定律 ”, 强 调集 成 电路 容量 的 更 新 速度 将 旦 指数 式 增长 。 近 些 
年 来 ,计算 机 等 电子 设备 的 存储 容量 迅速 提升 ,尤其 是 云 存 储 技术 开始 兴 
起 ,人 们 利用 网 络 “ 云 ”资源 对 数据 进行 存储 ,计算 , 大 大 提高 了 数据 的 存储 
容量 和 存储 效率 ."?] @ 数 据 处 理 技 术 。 面 对 数量 巨大 的 非 结 构 化 数据 ,分 
布 式 计算 技术 应 运 而 生 , 能 够 对 大 规模 非 结构 化 数据 进行 分 布 处 理 ,提高 
数据 处 理 的 速度 和 效率 ,3? @@ 数 据 分 析 技 术 。 数 据 分 析 技 术 的 核心 是 数 
据 挖 掘 , 包 括 A/B 测试 、 聚 类 分 析 、 关 联 规则 挖掘 、 自 然 语 言 处 理 、 神 经 网 络 
等 技术 。 由 此 可 见 ,数据 存储 和 处 理 技术 的 提高 大 大 推进 了 大 数据 的 
发 展 。 

最 后 ,大 数据 的 发 展 还 得 益 于 人 类 认 知 能 力 的 进步 。 抛 去 技术 层面 ， 
从 数据 本 身 的 角度 来 看 ,大 数据 的 发 展 来 源 于 人 类 测量 .记录 和 分 析 世 界 
的 渴望 。 早 在 19 世纪 中 期 ,一 位 名 为 莫 里 (Matthew Fontaine Maury) 的 美 
国航 海 家 ,通过 人 工 观测 方法 记录 了 大 量 的 大 西洋 航海 数据 ,为 当时 的 航 
海 提供 了 有 利 的 指导 ,减少 了 风险 的 发 生 、 提 高 了 航海 效率 .5 这 一 事例 


[1] See Gary King,“Ensuring the Data-Rich Future of the Social Sciences”, SCIENCE， 
2011,p. 331. 

52] 这 里 的 “ 云 "是 一 种 对 互联 网 的 比喻 说 法 , 云 存 储 是 一 种 新 兴 的 网 络 存 储 技术 。 参 见 百 
度 百科 “ 云 存储 ” 词 条 , 载 百 度 百科 网 http://baike. baidu. com/link? url 二 AeepGk3N9UE 
JycUwqbwngy3xkuRGFUK2fZiX1tV7y5KYh04zHMQek27hmNNmqCGZZnl1SzB5FO2D4Au0KkN 
Vuq,2016 年 9 月 23 日 访问 。 

53] [日 ] 城 田 真琴 :《 大 数据 的 冲击 》, 周 自 恒 译 ,27 页 ,北京 ,人 民 邮 电 出 版 社 ,2013。 

54] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 。 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ， 
97 一 109 页 ,杭州 ,浙江 人 民 出 版 社 ,2013。 
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中 虽然 没有 任何 的 现代 信息 技术 进行 辅助 , 却 是 大 数据 思维 的 应 用 : 将 现 
象 转 化 为 数据 形式 进行 记录 和 观察 ,并 作为 决策 的 依据 。 大 数据 本 质 上 是 
一 种 “ 数 ”, 有 学 者 认为 大 数据 是 人 类 历史 上 的 第 二 次 数据 革命 :572 还 有 学 
者 认为 大 数据 带 来 了 人 类 历史 上 第 三 次 工业 革命 ,数据 分 析 技 术 如 同 蒸汽 
技术 .电力 技术 一 样 ,将 推动 人 类 生产 力 的 进一步 发 展 .522 由 此 可 见 , 大 数 
据 产生 的 最 根本 的 动力 还 是 来 源 于 人 类 认 知 能 力 的 进步 。 

(二 ) 大 数据 的 发 展 

国外 媒体 说 2013 年 是 世界 大 数据 的 元 年 .53 美国、 欧盟 、 日 本 等 国家 
和 地 区 的 大 数据 发 展 都 兴起 于 2013 年 前 后 。 早 在 奥巴马 政府 之 前 ,美国 
政府 就 已 经 开始 用 大 数据 技术 进行 行政 管理 ;2009 年 ,美国 建立 了 政府 大 
数据 网 站 (Data. gov) ,用 以 公布 政府 各 部 门 的 数据 ,截至 2016 年 9 月 已 经 
有 186 770 个 数据 库 ,涵盖 农业 商业、 消费 ,天气 等 14 个 领域 ;2012 年 奥 巴 
马 政府 将 大 数据 上 升 为 国家 战略 高 度 .543 欧盟 及 其 成 员 国 也 明确 提出 大 
数据 发 展 战略 ,强调 数据 的 开放 和 共享 ,强调 将 数据 的 价值 转化 为 生产 动 
力 。 日本、 印度 ,韩国 .新 加 坡 等 国家 也 都 将 大 数据 纳入 了 国家 发 展 计划 。 
日 本 于 2010 年 7 月 设立 了 政府 大 数据 网 站 ,公开 政府 数据 ,甚至 还 出 现 了 
专门 的 数据 市 场 , 数 据 经 销 商 , 将 数据 作为 商品 来 进行 生产 和 销售 ;552 
2012 年 日 本 政府 将 发 展 大 数据 作为 国家 战略 。 印 度 近 两 年 也 开始 重视 大 
数据 ,并 提出 建设 大 数据 智慧 城市 的 计划 ,韩国 和 新 加 坡 都 提出 要 建立 “ 智 
慧 国 家 ”的 计划 。55 


51] 刘 红 , 胡 新 红 :《 数 据 革命 从 数 到 大 数据 的 历史 考察 》, 载 (自然 辩证 法 通讯 》2013(6) 。 

52] 李 军 :《 大 数据 一 一 从 海量 到 精准 》,99 页 ,北京 ,清华 大 学 出 版 社 ,2014。 

[3] 参见 林琳 , 林 丽 柄 , 朱 家 顺 :《2013 大 数据 元 年 ), 载 人 民 网 http://finance. people. com. 
cn/n/2013/1225/c1004-23938488. html,2016 年 1 月 20 日 访问 。 

[C4] 参见 (美国 : 大 数据 国家 战略 》, 载 中 云 网 http://www. china-cloud. com/yunzixun/ 
yunjisuanxinwen/20140107_22578. html,2015 年 12 月 20 日 访问 。 

55] [日 ] 城 田 真琴 :《 大 数据 的 冲击 ), 周 自 恒 译 ,177 一 203 页 ,北京 ,人 民 邮 电 出 版 社 ,2013。 

56] 贵阳 大 数据 交易 所 :《2015 年 中 国 大 数据 交易 白皮书 ) 非 出 版 物 ),1 一 5 页 ,贵州 ,贵阳 
大 数据 交易 所 ,2015。 
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相 比 于 上 述 国家 ,我 国 大 数据 的 发 展 步伐 要 略 慢 一 些 。 在 我 国 的 大 数 
据 发 展 进程 中 ,实行 的 是 地 方 战略 先行 的 发 展 路 径 。 近 几 年 各 省 市 纷纷 推 
出 地 方 大 数 据 发 展 战略 ,如 广东 省 在 2012 年 启动 大 数据 建设 战略 ,推出 统 
一 的 信息 平台 ,建设 智慧 城市 ;1 ?上 海 市 在 2013 年 启动 大 数据 战略 ,规划 
了 上 海 市 从 理论 到 技术 ,从 产品 到 应 用 的 大 数据 计划 .522 此 外 ,陕西 省 也 
推出 大 数据 产业 发 展 战略 ,贵州 省 成 立 了 大 数据 战略 重点 实验 室 ,北京 市 
将 云 计算 和 网 格 化 技术 运用 至 社会 管理 中 。 据 悉 , 我 国 已 经 有 超过 两 百 个 
城市 提出 建设 大 数据 智慧 城市 的 计划 。 

如 果 说 国外 的 大 数据 发 展 元 年 是 2013 年 ,那么 我 国 的 大 数据 发 展 元 
年 则 应 该 是 2015 年 ,这 一 年 三 件 里 程 碑 式 的 事件 推动 了 大 数据 发 展 。 第 
一 ,全 国 首 家 大 数据 交易 所 成 立 。2015 年 4 月 贵阳 大 数据 交易 所 成 立 , 成 
为 全 国 首 个 大 数据 交易 所 。 此 后 又 出 现 了 东湖 交易 所 ,长 江 交 易 所 等 专门 
的 数据 交易 市 场 , 以 及 新 型 数据 交易 的 电 商 平台 。 我 国 的 “大 数据 市 场 " 已 
经 初步 形成 。 第 二 ,国务 院 颁布 (促进 大 数据 发 展 行动 纲要 》。2015 年 8 月 
31 日 国务 院 正 式 发 布 (促进 大 数据 发 展 行动 纲要 》, 强 调 了 大 数据 的 战略 地 
位 ,提出 政府 数据 资料 开放 和 共享 的 计划 ,加 强 数 据 基 础 设施 建设 ,推进 大 
数据 在 工业 农业、 服务 业 等 各 行 各 领域 的 建设 应 用 。 同 时 建立 大 数据 安 
全 保障 体系 ,制定 相关 法 律 法 规 及 大 数据 标准 规范 体系 ,等 等 .和 3 第 三 ,党 
的 十 八 届 五 中 全 会 正式 提出 国家 大 数据 战略 。 在 2015 年 10 月 26 日 至 29 
日 的 中 国共 产 党 第 十 八 届 中 央 委 员 会 第 五 次 全 体会 议 上 ,提出 并 通过 了 
“国家 大 数据 战略 ”, 标 志 着 大 数据 正式 成 为 国家 战略 。 在 大 数据 战略 的 指 
导 下 ,我 国 在 未 来 几 年 内 必 将 会 围绕 大 数据 进行 相关 的 技术 产业、 制度 及 
法 律 法 规 建设 ,大 数据 的 应 用 也 会 逐渐 普及 到 各 个 领域 。 除了 上 述 的 三 大 
里 程 碑 事件 外 , 近 几 年 来 中 央 层 面 出 台 的 一 系列 文件 也 大 大 推动 了 大 数据 
的 发 展 。( 详 情 参见 表 2-1) 


51] 参见 (广东 省 率先 启动 大 数据 战略 相关 工作 正 有 序 进行 》, 载 中 国政 府 网 http://www. 
gov. cn/gzdt/2012-12/06/content_2283845. htm,2016 年 9 月 25 日 访问 。 

52] 参见 (上 海 推进 大 数据 研究 与 发 展 三 年 行动 计划 (2013 一 2015 年 )》, 载 上 海 科 技 网 
http://www. stcsm. gov. cn/gk/ghjh/333008. htm,2016 年 9 月 25 日 访问 。 

53] 参见 (国务 院 促进 大 数据 发 展 行动 岗 要 》, 国 发 C2015]50 号 。 
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表 2-1 中 国 大 数据 发 展 的 重要 事件 
时 问 文件 /规划 /意见 思想 内 容 
2012 名 月 | 国务 院 ("十 二 天 "国家 训 略 性 新 兴 产 | 将 "新 一 代 信息 技术 产业 "作为 
业 发 展 规划 ) 重点 发 展 方向 之 一 
2013 年 1 月 | 世 信 部 (关于 数据 中 心 建设 布局 的 指 | 推动 数据 中 心 的 建设 和 布局 
导 意 见 》 
2015 年 3 月 | 李克强 总 理 的 政府 报告 制订 “互联 网 +" 行动 计划 
全 国 首 家 大 数据 交易 所 ,进行 
2015 年 4 月 | 贵阳 大 数据 交易 中 心 大 数据 交易 及 相关 的 数据 处 再 
业务 ,促进 数据 的 利用 和 流通 
201 名 月 | 国务 院 (关于 积极 拟 进 "互联 网 " 行 | 要 将 互联 网 与 其 他 制造、 民生 
动 的 指导 意见 ) 等 领域 相 结合 
2015 种 1 月 | 国务 院 办 公 厅 (关于 运用 大 数据 加 强 | 运用 大 数据 加 强 对 市 场 主体 的 
对 市 场 主体 服务 和 监管 的 若干 意见 》| 服务 和 监管 
- AR | 将 大 数据 上 天 为 国家 战略 高 
2015 年 8 月 | 国务 院 (促进 大 数据 发 展 行动 纲要 》 | 营 太 呈 拉 二天 名 
2015 年 10 月 | 党 的 十 作 届 五 中 全 全 大 数据 国家 战略 
2016 年 3 月 | “十 三 五 "规划 纲要 再 次 强调 国家 大 数据 战略 





二 、 大 数据 的 概念 与 特征 


(一 ) 大 数据 的 概念 
尽管 各 行 各 业 都 在 强调 大 数据 的 运用 ,但 是 大 部 分 人 可 能 并 不 真正 理 





解 到 底 什么 是 大 数据 ,不 少 人 认为 大 数据 仅仅 是 海量 的 数据 集合 。 目 前 ， 
专业 领域 内 对 于 大 数据 的 概念 也 并 没有 统一 的 认识 ,不 过 对 大 数据 概念 的 
界定 肯定 不 仅仅 局 限于 “数据 ”本 身 。 

目前 ,学 界 对 于 大 数据 的 概念 主要 有 以 下 三 种 认识 : 第 一 ,从 大 数据 
“大 ”的 特征 进行 界定 ,强调 大 数据 是 海量 数据 的 集合 ;第 二 ,对 大 数据 进 
行 综合 全面 的 界定 ,大 数据 不 仅 包 括 数据 本 身 ,还 包括 与 大 数据 相关 的 技 


C1 [日 ] 城 田 真琴 :《 大 数据 的 冲击 》, 周 自重 译 .3 页 ,北京 ,人 民 邮 电 出 版 社 ,2013。 白 建 
军 :《 大 数据 对 法 学 研究 的 些许 影响 》, 载 (中 外 法 学 ),2015(1) 。 
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术 、 人 才 、 制 度 等 ;" 第 三 ,从 大 数据 的 价值 出 发 ,强调 大 数据 的 核心 价值 在 
于 背后 所 蕴藏 的 规律 ,这 一 观点 以 “大 数据 之 父 " 舍 恩 伯 格 为 代表 。"? 大 数 
据 本 身 就 是 个 开放 的 理念 ,上 述 对 大 数据 概念 的 不 同 界定 ,反映 了 学 者 们 
对 大 数据 认识 的 多 元 化 ,他 们 从 个 人 的 知识 结构 和 研究 旨 趣 出 发 ,对 大 数 
据 有 着 不 同 角度 的 解读 。 

本 书 认为 ,大 数据 包括 海量 数据 集 、 数 据 分 析 技 术 以 及 大 数据 分 析 结 
果 这 三 层 仿 义 。 首 先 , 大 数据 是 海量 数据 的 集合 ,它们 构成 了 大 数据 分 析 
的 基础 ,并 且 这 些 数据 具有 量 大 、 结 构 多 样 特征 。 其 次 ,大 数据 还 是 一 种 以 
数据 挖掘 为 核心 的 数据 分 析 技 术 , 只 有 通过 数据 分 析 技 术 , 才 能 够 发 掘 出 
数据 背后 的 价值 。 最 后 ,大 数据 还 强调 经 过 分 析 、 处 理 后 所 获取 的 数据 结 
果 , 它 们 往往 能 够 反映 出 数据 背后 的 规律 ,是 大 数据 的 价值 和 精髓 所 在 。 
总 而 言 之 ,本 书 对 大 数据 的 理解 基于 广义 的 视角 ,海量 数据 集 、 数 据 分 析 技 
术 、 数 据 分 析 结 果 都 属于 大 数据 的 范畴 。 另 外 ,针对 部 分 人 对 于 大 数据 的 
误解 ,在 理解 大 数据 时 还 有 以 下 三 个 要 点 。 

(1) 大 数据 的 基础 在 于 “数据 化 ”。 在 大 数据 的 角度 看 来 ,任何 事物 、 现 
象 .行为 都 是 由 数据 构成 的 ,而 通过 数据 的 描述 又 可 以 还 原 出 任何 现象 . 行 
为 及 其 背后 的 规律 ,这 一 “数据 化 ?原理 便 是 大 数据 运用 的 基础 .2 在 当 
代 , 随 着 传 感 技术 的 发 展 , 人 类 数据 化 的 范围 和 速度 大 大 提升 。 从 “人 ”的 
数据 到 * 物 ”的 数据 ,从 身份 数据 到 行动 轨迹 ,甚至 连 睡眠 .情绪 都 可 以 数据 
化 ,可 以 说 “万 物 皆 可 数据 化 ”一 切 皆 可 量化 ”。 

(2) 大 数据 的 量 大 是 相对 的 。 大 数据 最 直观 的 特征 莫 过 于 数据 量 之 
“大 ”了 ,那么 数据 量 需要 达到 何 种 程度 才 可 谓 之 于 “大 数据 ? 呢 , 是 不 是 一 
定 要 达到 PB、ZB 甚至 只 是 EB 的 级 别 呢 ? 其 实 , 大 数据 之 “大 ”是 相对 于 小 
数据 而 言 的 。 在 传统 的 小 数据 时 代 , 由 于 数据 采集 技术 条 件 所 限 , 人 们 只 


51] [日 ] 城 田 真琴 :《 大 数据 的 冲击 ), 周 自 恒 译 ,8 页 ,北京 ,人 民 邮 电 出 版 社 ,2013 。 

52] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 " 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ,4 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 

53] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015(5) 。 
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能 采取 抽样 调查 法 ,选取 一 定 的 样本 进行 对 象 的 分 析 。 在 大 数据 时 代 , 收 
集 所 有 的 数据 不 再 是 不 可 能 的 事情 ,完全 可 以 通过 相关 技术 收集 到 与 某 一 
事物 相关 的 所 有 数据 ,达到 “样本 二 全体 ”的 数量 级 。 另 外 ,大 数据 之 “大 ” 
也 是 有 限度 的 。 数 据 之 大 是 相对 于 分 析 对 象 而 言 ,只 要 相对 于 分 析 对 象 是 
全 体 数据 即 可 ;况且 , 当 数 据 超 过 一 定量 时 ,数据 的 继续 增加 并 不 会 对 结果 
有 多 少 影响 。 因 此 当 样 本 的 数量 大 到 足够 得 出 结论 时 , 便 可 以 认为 是 所 谓 
的 “大 数据 .5 

(3) 大 数据 的 核心 在 于 数据 背后 的 价值 。 大 数据 本 身 并 不 意味 着 大 价 
值 ,如 果 不 对 数据 进行 分 析 、 挖 掘 ,大 数据 只 是 死 气 沉沉 的 “数据 坟墓 >。 唯 
有 灵活 运用 数据 分 析 、 处 理 技术 , 方 能 发 现 大 数据 背后 的 规律 ,特征 ,真正 
发 挥 大 数据 的 价值 .522 

(二 ) 大 数据 的 特征 

提 到 大 数据 的 特征 ,学界 的 通 说 是 大 数据 *3V” 特 征 。 这 里 的 “V? 是 英 
文 单词 的 缩写 ,3V 指 的 是 Volume( 大 容量 )、Variety( 多 样 性 ) 和 Velocity 
(数据 产生 频率 、 更 新 频率 快 )。 大 数据 的 “3V” 特 征 说 法 最 早 来 源 是 2001 年 
麦 塔 集团 (META Group) 分 析 员 道 格 。 莱 尼 (Doug Laney) 的 一 份 演讲 报 
告 ,报告 中 指出 未 来 数据 管理 将 会 面临 这 三 个 方面 的 挑战 53] 后 来 “3V” 
特征 说 就 成 了 大 数据 特征 的 通 说 ,并 一 直 沿用 至 今 。 此 后 ,很 多 学 者 又 在 
“3V” 特 征 上 发 展 出 其 他 特征 ,如 Veracity( 大 数据 的 准确 性 ), Variability 
(大 数据 的 异 变 性 )、Value( 大 数据 的 价值 ) ,等 等 54 

第 一 ,容量 大 (Volume)。 人 类 的 数据 量 已 经 从 传统 的 KB、MB 增长 到 
TB、PB 乃至 ZB, 随 着 数据 化 的 趋势 及 互联 网 的 发 展 ,未 来 数据 量 还 会 继续 
增长 。 据 相关 数据 统计 ,每 一 天 互联 网 上 产生 的 数据 可 以 刻 满 1 亿 多 张 


C1] 白 建 军 :《 大 数据 对 法 学 研究 的 些许 影响 》, 载 (中 外 法 学 ),2015(11) 。 

52] 单 志 广 :《 关 于 促进 大 数据 发 展 行动 纲要 解读 ), 载 新 华 网 http://news. xinhuanet. com/ 
info/2015-09/17/c_134632375. htm,2016 年 9 月 25 日 访问 。 

[C3] 维基 百科 big data 词 条 , 载 维 基 百 科 网 http://en. wikipedia. org/wiki/Big_data,2016 年 
9 月 25 日 访问。 

54] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 )》,2015(5) 。 
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DVD, 发 出 近 3000 亿 封 邮件 ,200 万 个 帖子 ,上 传 2. 5 亿 张 图 片 .2 预计 
2020 年 全 球 的 数据 量 将 会 达到 35ZB, 这 意味 着 在 最 近 两 年 产生 的 数据 量 
相当 于 人 类 之 前 所 有 数据 量 的 总 和 .2 

第 二 ,多 样 性 (Variety) 。 多 样 性 主要 是 指 大 数据 所 包含 数据 类 型 的 繁 
多 。 大 部 分 的 大 数据 都 是 以 非 结 构 化 数据 的 形式 存在 ,如 日 志文 件 、 点 击 
流 、 富 文本 文档 、 网 页 、 多 媒体 等 “3 它们 处 理 起 来 相对 困难 ,所 需要 的 数 
据 分 析 技 术 也 更 加 复杂 。 

第 三 ,速度 快 (Velocity)。 在 以 前 ,都 是 对 数据 进行 事后 收集 、 分 析 , 具 
有 一 定 的 沾 后 性 。 然 而 在 大 数据 时 代 , 数 据 产 生 、 更 新 的 速度 越 来 越 快 ,各 
行 各 业 都 强调 对 数据 进行 实时 的 流 处 理 , 以 保证 数据 的 新 鲜 度 。 

上 述 的 “3V? 特 征 是 从 数据 本 身 的 属性 出 发 。 当 大 部 分 学 者 都 在 关注 
大 数据 本 身 的 属性 特征 时 ,也 有 个 别 先 驱 者 从 更 深层 次 的 思维 、 方 法 论 角 
度 去 探索 大 数据 的 特征 。 长 和 久 以 来 ,我 们 对 世界 的 认 知 都 是 遵循 “小 数据 ” 
逻辑 思维 ,依托 一 个 独立 的 数据 点 产生 的 直觉 来 分 析 问 题 .“ ” 相 比 于 小 数 
据 时 代 的 思维 方法 ,大 数据 在 思维 方面 的 特征 主要 体现 在 以 下 几 个 方面 。 

第 一 ,全 数据 。 在 小 数据 时 代 , 由 于 人 类 获取 信息 的 能 力 有 限 ,一 直 采 
用 抽样 调查 的 方法 ,希望 通过 科学 的 抽样 方法 来 获取 尽 可 能 准确 的 统计 结 
果 。 但 即使 选取 样本 的 方法 再 科学 ,也 无 法 获取 全 部 的 数据 ,而 一 些 重要 
的 信息 很 可 能 就 在 这 些 “ 非 样本 ”数据 中 。 然 而 ,抽样 法 只 是 小 数据 时 代 不 
得 已 而 采取 的 办 法 ,在 大 数据 时 代 我 们 完全 有 条 件 去 获得 某 个 研究 对 象 的 
所 有 数据 ,不 必 再 拘泥 于 技术 条 件 所 限 进行 数据 抽样 分 析 , 这 样 便 不 会 错 
过 任何 一 个 数据 中 所 隐藏 的 信息 。 

第 二 ,混杂 性 。 在 小 数据 时 代 , 由 于 抽样 的 数据 量 有 限 , 因 而 对 每 个 数 
据 的 质量 要 求 都 很 高 。 然 而 ,在 大 数据 时 代 , 由 于 数据 量 的 巨大 、 数 据 结构 


C1) 《互联 网 上 一 天 : 发 2940 亿 邮 件 下 载 3500 万 应 用 》, 载 腾讯 网 http:/ /tech. qq. com/a/ 
20120306/000306_2. htm,2016 年 9 月 26 日 访问 。 

52] 赵刚 :《 大 数据 一 一 技术 与 应 用 实践 指南 》,2 页 ,北京 ,电子 工业 出 版 社 ,2013。 

53] 赵刚 :《 大 数据 一 一 技术 与 应 用 实践 指南 ),9 一 11 页 ,北京 ,电子 工业 出 版 社 ,2013。 

C4 赵 伟 :《 大 数据 在 中 国 ),140 页 ,南京 ,江苏 文艺 出 版 社 ,2014。 
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的 混杂 ,很 难保 证 每 一 数据 都 精准 无 误 ,并且 数 据 量 的 巨大 往往 可 以 忽略 、 
抵消 这 些 误差 。 此 外 ,物理 学 的 经 验 告诉 我 们 ,误差 从 来 都 是 存在 的 ,数据 
错误 不 是 大 数据 才 有 的 特性 .5 总 之 ,大 数据 更 强调 数据 的 完整 性 和 混杂 
性 ,通过 纷繁 复杂 、 多 元 化 的 数据 去 认 知 世界 。 

第 三 ,相关 性 。 小 数据 时 代 人 们 遵循 的 是 因果 逻辑 思维 。 我 们 预先 确 
立 了 研究 对 象 , 之 后 根据 主题 去 搜集 相关 数据 ,这 些 数据 往往 带 有 一 定 的 
“假想 性 ”, 得 出 的 结果 有 较 强 的 因果 关系 。 因 果 关 系 强调 不 仅 要 知道 是 什 
么 ,还 要 知道 为 什么 。 而 在 大 数据 方法 中 ,我 们 则 可 以 不 带 任何 偏见 、 设 想 
地 对 数据 进行 分 析 。 大 数据 算法 能 够 直接 告诉 我 们 数据 之 间 的 相关 关系 ， 
即 “ 是 什么 ”而 非 “ 为 什么 ”。 很 多 时 候 ,我 们 知道 “是 什么 ”就 已 经 足够 了 。 
这 方面 最 典型 的 例子 莫 过 于 “啤酒 和 尿布 ”的 故事 一 一 美国 沃尔玛 超市 对 
销售 数据 分 析 后 发 现 ,啤酒 与 尿布 经 常 出 现 同 一 购物 篮 中 ,超市 也 并 不 知 
道 这 其 中 的 缘由 ,但 超市 需要 做 的 就 是 根据 大 数据 分 析 结果 ,将 尿布 与 啤 
酒 放 在 一 起 销售 即 可 。 2?” 

总 之 ,大 数据 不 仅仅 具有 容量 大 、 速 度 快 和 多 样 性 的 特征 ,更 是 推动 了 
人 类 思维 方式 ,方法论 的 进步 和 革新 。 正 如 有 学 者 认为 大 数据 思维 是 一 种 
数据 化 的 “整体 思维 “更 多 ”更 杂 ” 更 好 ?的 特征 推动 了 人 类 生产 力 的 
进步 。531 


第 二 节 大 数据 侦查 的 介 说 


在 提出 大 数据 侦查 的 概念 之 前 ,我 们 先 通过 一 则 实务 案例 去 直观 感受 
大 数据 在 侦查 中 的 作用 。 
犯罪 嫌疑 人 苑 某 因 盗 窃 罪 被 省 X 县 公安 机 关 抓 获 。 苑 某 长 期 在 高 


51] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 、 库 克 耶 :《 大 数据 时 代 》, 盛 杨 莫 ,周涛 译 ,56 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 

52] 后 来 经 分 析 , 发 现 是 因为 年 轻 的 父亲 在 购买 尿布 时 ,通常 也 会 顺便 购买 一 打 啤 酒 作为 对 
自己 的 奖励 。 

53] 黄 欣 荣 :《 大 数据 时 代 的 哲学 变革 》, 载 (光明 日 报 》,2014 年 12 月 3 日 ,第 15 版。 
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速 公 路 上 选择 货运 车 作为 盗窃 目标 ,采取 夜间 并 车 行驶 的 方法 ,利用 驾驶 员 
右 后 视 镜 盲区 , 盗 取 货车 上 的 物品 。 公 安 机 关 共 审理 查 明 了 嫌疑 人 2012 年 
2 月 23 一 24 日 在 J 省 X 县 境内 的 3 起 扒 车 盗窃 事实 。 在 公安 机 关 侦 查 阶 
段 ,犯罪 嫌疑 人 苑 某 做 了 6 次 供述 ,前 后 供述 稳定 , 且 与 部 分 被 害 人 供述 、 
证 人 证 言 能 够 相互 印证 。 但 是 在 检察 机 关 审查 起 诉 阶段 ,犯罪 嫌疑 人 却 翻 
供 ,声称 其 遭受 了 和 警察 的 刑讯 逼供 ,供述 都 是 按照 公安 的 指示 交代 的 ,并 声 
称 其 从 未 去 过 ] 省 X 县 (嫌疑 人 苑 某 是 外 地 HH 省 人 ), 资 穷 现场 笔录 及 指认 
照片 都 在 警察 诱导 下 所 作 , 自 己 根本 不 知道 那 地方 。 当 时 ,侦查 人 员 认 害 
事实 的 主要 依据 就 是 犯罪 嫌疑 人 的 供述 ,以 及 部 分 证 人 证 言 , 被 害 人 陈述 、 
现场 勘 验 笔录 ,而 案件 中 大 部 分 赃物 已 经 下 落 不 明 , 作 案 车 辆 也 尚未 找到 。 
因此 ,案件 一 时 陷入 了 僵局 。 在 补充 侦查 阶段 ,但 侦查 人 员 巧 妙 调 取 了 嫌 
疑 人 在 案 发 期 间 的 手机 基站 数据 ,基站 数据 反映 , 案 发 时 段 的 嫌疑 人 的 7 
次 通话 地 点 都 是 案 发 地 点 J 了 省 X 县 。 最 终 ,检察 机 关 认为 嫌疑 人 侦查 阶段 
供述 稳定 , 且 与 证 人 证 言 ,被害人 陈述 以 及 手机 基站 数据 相 印 证 ,认定 了 嫌 
疑 人 的 盗窃 事实 。 

本 案例 是 笔者 与 ] 省 X 县 基层 检察 人 员 访 谈 时 所 获取 的 案例 。 案 件 
承办 人 员 表 示 , 如 果 不 是 因为 补 查 阶 段 所 获取 的 手机 基站 数据 ,就 无 法 印 
证 嫌疑 人 供述 的 真实 可 靠 性 ,从 而 也 就 无 法 定案 了 。 其 实 ,本 案 中 的 手机 
基站 数据 的 运用 就 反映 了 “大 数据 思维。 基站 数据 本 身 是 对 嫌疑 人 时 空 
位 置 的 “数据 化 ”, 通 过 对 手机 基站 数据 查询 也 就 间接 地 还 原 了 嫌疑 人 当时 
的 时 空位 置 。 据 反映 ,实务 中 通过 “大 数据 ”来 侦破 的 类 似 案例 也 越 来 越 
多 ,在 此 大 趋势 下 ,本 书 提出 “大 数据 侦查 ”的 概念 。 


一 、 大 数据 侦查 概念 的 提出 


(一 ) 传统 “侦查 ”的 概念 

在 提出 大 数据 侦查 概念 之 前 ,我 们 需要 先 厘清 传统 “侦查 ”的 含义 。 早 
在 20 世纪 七 八 十 年 代 , 我 国 对 “侦查 ”和 “侦察 ”这 一 对 概念 尚 还 辨别 不 清 ， 
实务 及 理论 界 运用 混乱 。 “侦察 ”与 军事 活动 相关 ,不 是 严格 的 法 律 术语 ; 
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而 侦查 则 是 专门 的 法 律 术语 ,更 具有 规范 性 .5 随 着 现代 法 治 化 的 进程 ， 
“侦查 "一 词 也 逐渐 取代 了 ”侦察 ”作为 法 定 用 语 。 

我 国 (刑事 诉讼 法 ) 第 106 条 第 1 款 明确 指出 了 ”侦查 "的 主体 和 内 容 ， 
大 部 分 学 者 也 是 根据 这 一 法 律 规定 出 发 ,来 理解 侦查 的 内 涵 。"? 总 而 言 
之 , “传统 "侦查 概念 具有 以 下 内 涵 : 第 一 ,侦查 的 主体 是 法 定 的 国家 机 关 ， 
以 公安 机 关 和 检察 机 关 为 主 ;在 一 定 情形 下 ,国家 安全 机 关 、 军 队 保 卫 部 
门 、 监 狱 等 机 关 也 享有 一 定 的 侦查 权 。 第 二 ,侦查 启动 的 时 间 必 须 是 在 立 
案 之 后 。 在 我 国 ,立案 是 侦查 的 前 置 程序 , 唯 有 经 过 法 定 立 案 才 能 开启 侦 
查 程序 。 第 三 ,侦查 的 内 容 包括 调查 取证 措施 和 强制 性 措施 。 第 四 ,侦查 
作为 一 项 诉讼 活动 ,往往 涉及 对 公民 权利 的 剥夺 ,因此 必须 依照 法 定 程 序 
进行 。53 
尽管 传统 侦查 的 概念 已 经 基本 形成 通 说 ,但 笔者 认为 ,上 述 的 观点 仍 
具有 一 定 的 局 限 性 。 例 如 就 侦查 的 内 容 而 言 ,除了 法 律 明文 规定 的 侦查 措 
施 外 ,实务 中 还 经 常 运用 到 法 未 明文 规定 的 侦查 措施 ,如 围 人 妃 堵 截 、. 跟 踪 守 
候 、 外 线 侦查 , 特 情 侦查 ,等 等 。 所 有 揭露 .证 实 犯罪 , 抓 捕 嫌疑 人 ,收集 犯 
罪证 据 的 方法 均 应 视 为 侦查 措施 。“ ;7 就 侦查 时 间 而 言 , 通 说 认为 侦查 必须 
在 立案 之 后 才能 启动 ,但 这 往往 与 实践 中 的 做 法 相悖 。 立 案 需 要 建立 在 
“发 现 犯罪 事实 或 者 犯罪 嫌疑 人 ”的 基础 上 ,然而 不 经 过 一 定 的 调查 措施 则 
无 法 确定 犯罪 事实 及 犯罪 嫌疑 人 。 因 此 实务 中 存在 着 “ 初 查 ” 及 “ 立 线 侦 
查 ” 的 做 法 ,这 就 与 法 定 的 侦查 时 间 形 成 了 悖 论 。 不 少 学 者 也 开始 对 侦查 


[C1] 马 海 舰 :《 侦 查 措施 新 论 》,1 一 2 页 ,北京 ,法 律 出 版 社 ,2012。 

52] 例如 有 学 者 认为 侦查 是 国家 法 定 机 关 在 办 理 刑事 案件 过 程 中 ,为 收集 犯罪 证 据 和 查获 
犯罪 人 而 依法 进行 的 专门 调查 工行 和 有 关 强 制 性 措施 。 陈 永生 :《 侦 查 程 序 原理 论 》,21 页 ,北京 ， 
中 国人 民 公 安 大 学 出 版 社 ,2003。 例 如 有 学 者 认为 侦查 是 警察 机 关 和 检察 机 关 在 办 理 刑事 案件 的 
过 程 中 ,为 了 收集 证 据 ,揭露 犯罪 ,揭发 犯罪 人 而 依照 法 律 规定 所 实施 的 调查 性 措施 和 强制 措施 。 
任 惠 华 :《 侦 查 学 原理 ),119 页 ,北京 ,法 律 出 版 社 ,2002。 

[3] 何 家 弘 :《 新 编 犯罪 侦查 学 ).60~61 页 ,北京 ,中 国法 制 出 版 社 ,2007。 

54] 马 海 舰 :《 侦 查 措施 新 论 ),14 页 ,北京 ,法 律 出 版 社 ,2012。 
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的 启动 时 间 提 出 质疑 ,建议 将 侦查 启动 时 间 提 前 至 立案 之 前 。 ”有 学 者 指 
出 ,侦查 ”的 概念 本 身 就 具有 多 样 性 和 开放 性 ,可 以 被 理解 为 一 个 过 程 .一 
套 程序 .一 种 权力 等 , 正 是 概念 界定 的 多 元 化 和 开放 性 , 才 有 利于 我 们 推进 
与 侦查 相关 范畴 的 研究 .5?] 本 文 也 立足 于 开放 性 的 侦查 概念 ,并 在 此 基础 
上 去 建立 大 数据 侦查 的 内 涵 。 

(二 )“ 大 数据 侦查 ”的 概念 

本 书 所 谓 的 “大 数据 侦查 "并 不 是 个 标准 的 法 律 概念 ,学 理 界 也 并 未 有 
约定 俗 成 的 界定 。 虽 然 近 两 年 大 数据 在 侦查 领域 的 运用 也 已 经 有 了 不 少 
研究 成 果 , 但 是 目前 大 数据 侦查 的 研究 仍 在 感性 层面 摸索 前 进 ,在 理论 和 
实践 层面 都 尚未 形成 成 熟 的 体系 。 大 部 分 学 者 多 是 将 大 数据 作为 侦查 背 
景 ,或 者 将 其 作为 新 的 侦查 技术 来 展开 研究 。 本 书 在 传统 侦查 概念 及 现 有 
研究 的 基础 上 ,从 广义 和 狭义 两 个 角度 去 理解 “大 数据 侦查 ”的 概念 。 

从 广义 角度 来 看 “大 数据 侦查 ”包括 大 数据 侦查 思维 .大 数据 侦查 模 
式 、 大 数据 侦查 方法 、 大 数据 侦查 机 制 等 完整 的 体系 。 本 书 也 拟 以 大 数据 
作为 主线 ,串联 起 整个 大 数据 侦查 的 框架 ,探讨 大 数据 技术 对 侦查 模式 、 侦 
查 方法 、 侦 查 思维 、 侦 查 制度 等 方面 带 来 的 一 系列 影响 与 变革 ,构成 一 幅 完 
整 的 “大 数据 侦查 "图景 。 

从 狭义 角度 来 看 ,大 数据 侦查 则 着 重 强调 侦查 中 对 大 数据 技术 的 运 
用 。 可 以 将 其 界定 如 下 :“ 大 数据 侦查 ?是 指法 定 侦查 机 关 针 对 已 发 生 或 尚 
未 发 生 的 犯罪 行为 ,为 了 查 明 犯 罪 事实 、 预 测 犯罪 等 ,所 采取 的 一 切 以 大 数 
据 技术 为 核心 的 相关 侦查 行为 。 相 比 于 传统 侦查 的 概念 ， 大 数据 侦查 ” 需 
要 注意 以 下 几 点 。 

第 一 ,大 数据 侦查 的 外 延 要 宽 于 传统 侦查 。 传 统 的 侦查 概念 中 将 侦查 
对 象限 定 为 已 经 确定 立案 的 刑事 案件 ,没有 立案 的 不 能 对 其 实施 侦查 。 但 
本 书 拟 构建 一 种 广义 上 的 侦查 理念 ,将 侦查 的 时 间 外 延 向 前 延伸 ,将 “预测 





51] 孙 展 明 :《 论 我 国 侦查 启动 模式 的 重 构 》, 载 (中 南 林 业 科技 大 学 学 报 》( 社 会 科学 版 )， 
2011(2) 。 
52] 郭 冰 :《 侦 查 学 基础 理论 研究 ),59 一 60 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2010。 
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型 侦查 ”纳入 其 中 。 具 体 来 说 ,大 数据 侦查 的 对 象 可 以 分 为 两 类 ,一 类 与 传 
统 侦查 的 对 象 一 致 ,是 已 经 发 生 的 、 确 已 立案 的 犯罪 活动 ; 另 一 类 则 是 尚未 
发 生 或 者 即将 发 生 的 犯罪 活动 ,以 及 虽 已 经 发 生 但 未 被 察觉 ,未 被 立案 的 
犯罪 活动 。 概 言 之 ,已 经 发 生 的 犯罪 行为 和 尚未 发 生 的 犯罪 行为 ,都 是 大 
数据 侦查 的 对 象 。 本 书 之 所 以 将 大 数据 侦查 的 时 间 轴 向 前 延伸 ,是 基于 以 
下 几 点 考量 : 传统 的 立案 侦查 本 就 不 具有 合理 性 。 我 国 刑事 诉讼 法 规定 
侦查 程序 只 能 在 立案 之 后 才能 启动 ,而 立案 必须 达到 “发 现 犯罪 事实 或 嫌 
疑 人 ”的 要 求 。 但 是 ,很 多 时 候 为 了 发 现 犯罪 事实 或 嫌疑 人 又 必须 采取 一 
定 的 侦查 活动 ,如 此 一 来 , 便 与 法 定 的 立案 侦查 形成 了 了 矛盾 ,实务 中 也 不 乏 
初 查 和 立 线 侦查 的 做 法 。 况 且 , 破 案 讲究 时 效 性 ,很 多 时 候 待 到 立案 之 后 
再 实施 侦查 活动 ,往往 就 延误 了 最 佳 破案 时 机 。 鉴 于 此 , 越 来 越 多 的 学 者 
呼吁 将 启动 侦查 程序 的 时 间 提 前 57) @ 大 数据 为 犯罪 预测 提供 了 技术 方 
法 支持 。 大 数据 最 核心 的 价值 就 在 于 预测 ,其 能 够 通过 回归 分 析 、 聚 类 分 
析 等 数据 挖掘 技术 来 发 现 事 物 之 间 的 关系 及 发 展 规律 ,将 之 用 于 未 来 时 空 
便 能 在 一 定 程度 上 实现 对 特定 领域 的 预测 。 对 于 犯罪 活动 同样 如 此 ,大 数 
据 技术 方法 能 够 实现 对 犯罪 地 点 ,犯罪 类 型 ,犯罪 嫌疑 人 等 信息 的 预测 ,在 
一 些 犯罪 活动 尚未 发 生 时 就 能 够 及 时 将 其 识别 ."* @ 有 利于 保障 国家 和 
公民 的 利益 ,维护 社会 稳定 。 犯 罪 是 小 部 分 犯罪 分 子 对 国家 和 公民 利益 造 
成 了 侵害 。 对 于 普通 公民 而 言 ,将 侦查 时 间 提 前 ,尤其 是 在 犯罪 活动 尚未 
发 生 、 扩 大 之 时 就 及 时 将 其 预测 并 遏制 ,有 利于 防 患 于 未 然 ,保障 国家 和 公 
民 的 利益 免 受 侵害 ,保障 社会 秩序 的 稳定 。 即 便 是 对 于 犯罪 分 子 本 身 而 
言 , 在 犯罪 活动 开始 之 前 所 接受 的 惩戒 、 教 育 也 远 比 在 犯罪 活动 完成 后 所 
面临 的 惩罚 小 得 多 。@@ 有 利于 合理 分 配 侦查 资源 ,提高 侦查 效率 。 在 立案 
之 后 采取 侦查 措施 ,侦查 人 员 往 往 处 于 被 动 地 位 ,侦查 行为 容易 被 犯罪 嫌 


[1] 孙 展 明 :《 论 我 国 侦查 启动 模式 的 重 构 ), 载 (中 南 林业 科技 大 学 学 报 》( 社 会 科学 版 )， 
2011(2) 。 

52] 犯罪 预测 并 非 新 事物 ,但 是 过 去 的 犯罪 预测 主要 是 基于 人 们 的 主观 经 验 和 简单 的 数据 
统计 。 而 大 数据 在 预测 方面 的 巨大 功能 则 大 大 提高 了 犯罪 预测 的 准确 性 , 越 来 越 多 的 侦查 部 门 开 
始 将 大 数据 技术 吸收 至 对 未 来 犯罪 活动 的 预测 中 去 。 
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疑 人 所 牵制 ,局势 被 犯罪 嫌疑 人 所 主导 ,从 而 导致 侦查 成 本 增加 ,侦查 效益 
降低 。 而 在 大 数据 侦查 中 ,侦查 时 间 的 提前 使 得 侦查 人 员 处 于 主动 地 位 ， 
能 够 从 整体 上 把 控 局 势 ,有 的 放 矢 地 投放 侦查 资源 ;对 犯罪 活动 的 预测 防 
范 , 更 是 避免 了 侦查 资源 的 无 谓 投入 ,提高 了 侦查 效益 。@ 大 数据 预测 型 
侦查 已 然 成 为 时 代 发 展 趋势 。 目 前 ,很 多 侦查 实务 部 门 都 开始 利用 大 数 
据 、 人 工 智 能 等 技术 ,提前 预知 犯罪 活动 的 发 生 ,并 据 此 展开 警力 部 署 ,在 
犯罪 活动 发 生前 就 将 其 制止 。 例 如 美国 警方 利用 PredPol .COMPASTAT 
等 软件 去 预测 热点 犯罪 区 域 ,我 国 北京 怀柔 警方 也 有 着 类 似 的 做 法 。 随 着 
未 来 大 数据 技术 的 发 展 ,侦查 人 员 对 于 犯罪 时 间 、 地 点 、 类 型 及 犯罪 人 群 的 
预测 将 会 越 来 越 准确 ,大 数据 预测 型 侦查 的 发 展 必 将 是 大 势 所 趋 。 总 而 言 
之 ,大 数据 侦查 将 侦查 活动 的 外 延 向 前 延伸 ,从 已 经 立案 的 案件 拓展 到 尚 
未 发 生 ,或 已 发 生 但 未 被 发 现 的 案件 ,从 而 将 一 些 犯罪 苗头 .犯罪 准备 活动 
等 相关 问题 也 都 纳入 其 中 。" ”7 

第 二 ,大 数据 侦查 的 目的 比 传统 侦查 更 全 面 。 大 数据 侦查 的 目的 是 查 
明 犯 罪 事 实 及 预防 犯罪 活动 的 发 生 。 在 传统 的 侦查 概念 中 ,侦查 目的 一 般 
包括 查 明 案情 收集 证 据 、 抓 获 嫌 疑 人 等 ,总 体 而 言 还 是 以 查 明 犯 罪 为 主 。 
而 大 数据 侦查 的 目的 除了 查 明 犯 罪 外 ,还 包括 预防 犯罪 。 在 当今 大 数据 时 
代 , 预 测 、 预 防 犯 罪 都 已 经 具有 了 技术 条 件 上 的 可 能 性 ,如 果 还 将 侦查 的 目 
的 局 限于 对 犯罪 活动 事后 的 侦查 ,那么 根本 无 法 应 对 当今 时 代 有 瞬息 万 变 的 
犯罪 活动 。 另 外 ,将 大 数据 侦查 的 目的 归纳 为 查 明 犯罪 事实 及 预防 犯罪 ， 
也 与 大 数据 侦查 的 对 象 相 对 应 。 最 后 ,从 侦查 的 上 位 概念 一 一 刑事 诉讼 程 
序 出 发 ,其 目的 不 仅仅 是 查 明 犯罪 事实 .打击 犯罪 ,更 重要 的 在 于 保护 公民 
的 人 身 . 财 产 等 权利 。 预 防 犯罪 更 有 利于 从 源头 上 保护 公民 的 权利 ,将 其 
作为 侦查 的 目的 具有 实质 上 合理 性 .2 


51] 吕 雪 梅 :《 美 国 预 测 警 务 中 基于 大 数据 的 犯罪 情报 分 析 》, 载 4 情报 杂志 》,2015(12) 。 

52] 这 里 所 说 的 预防 犯罪 ,仅仅 是 从 目的 角度 去 阐述 大 数据 侦查 的 概念 ,并 不 是 本 书 讨论 的 
重点 。 概 言 之 ,犯罪 预测 属于 大 数据 侦查 的 范畴 ,而 犯罪 预防 虽然 是 犯罪 预测 的 后 续 行为 ,但 并 非 
属于 本 书 所 讨论 的 大 数据 侦查 范畴 ,其 更 多 地 属于 犯罪 学 领域 。 
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第 三 ,大 数据 侦查 的 技术 性 比 传统 侦查 更 强 。 传 统 侦查 中 所 采取 的 措 
施主 要 依靠 人 力 、 脑 力 劳动 或 者 辅 之 以 简单 工具 的 帮助 ,而 大 数据 侦查 则 
离 不 开 数据 科学 \ 人 工 智 能 等 专业 技术 的 帮助 。 例 如 传统 侦查 中 , 侦查 人 
员 往 往 采用 蹲点 守候 的 方式 来 确定 嫌疑 人 等 相关 人 员 的 落脚 点 ,需要 耗费 
大 量 的 精力 和 时 间 ; 如 果 采 用 大 数据 侦查 技术 , 则 可 以 根据 嫌疑 人 的 常用 
网 购 地 址 数据 或 者 手机 基站 位 置 等 数据 来 确定 其 落脚 点 。 





一 -J 主体 : 法 定 侦查 机 关 
广 一 | 对 象 : 已 经 发 生 或 尚未 发 生 的 犯罪 行为 





























| 一 | 目的 : 查 明 犯 罪 事 实 ， 预防 犯罪 发 生 
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图 2-3 大 数据 侦查 概念 


二 、 大 数据 侦查 的 特征 


(一 ) 侦查 空间 的 数据 化 

有 学 者 曾经 提出 多 网 络 时 代 “ 双 层 社会 ”的 理论 , 意 指 网 络 空间 和 现实 
空间 的 渗透 融合 "1 大 数据 时 代 的 到 来 ,又 赋予 了 “ 双 层 社会 "新 的 内 涵 。 
互联 网 就 像 是 一 个 光源 ,数据 相当 于 阴影 ,有 光源 的 地 方 就 会 有 阴影 ,几乎 
人 类 所 有 的 想法 和 行为 都 被 数据 记录 下 来 ,并 且 一 旦 记录 下 来 就 不 会 消 
除 。 从 而 形成 一 个 与 现实 空间 相对 应 的 、 相 平行 的 虚拟 数据 空间 ,我 们 每 


51] 于 志 刚 、 郭 旨 龙 :《 信 息 时 代 犯 罪 定量 标准 的 体系 化 构建 》,28 一 29 页 ,北京 ,中 国法 制 出 
版 社 ,2013。 
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个 人 都 可 以 在 数据 空间 找到 与 自己 相对 应 的 “数据 人 ”.523 大 数据 侦查 则 
正 是 在 这 样 的 一 个 平行 数据 空间 中 展开 的 ,侦查 人 员 根 据 现 实 空间 的 人 和 
事物 去 找到 其 对 应 的 数据 形式 ,再 从 数据 空间 返回 到 现实 空间 。 通 过 现实 
空间 与 数据 空间 的 交叉 ,通过 数字 阴影 之 间 的 碰撞 ,很 多 与 犯罪 行为 相关 

的 线索 ,信息 就 显现 出 来 了 。 所 以 说 ,大 数据 侦查 的 环境 是 与 现实 空间 相 
平行 的 数据 空间 。 

(二 ) 侦查 技术 的 智能 化 

面 对 海 量 的 数据 集 , 仅 靠 侦 查 人 员 的 人 工分 析 是 完全 不 可 能 的 ,必须 
运用 专业 的 大 数据 技术 。 大 数据 涉及 计算 机 、 数 据 科 学 .人 工 智 能 等 多 个 
学 科 , 需 要 运用 到 不 同 的 专业 技术 。 如 在 数据 采集 环节 ,需要 运用 传 感 技 
术 日 志文 件 、 网 络 怜 虫 等 技术 : ?在 数据 清洗 环节 ,需要 运用 专门 的 软件 ， 
来 修正 不 完整 .不 正确 的 数据 ,保障 数据 源 的 质量 ;在 数据 分 析 环 节 , 则 需 
要 运用 数据 挖掘 技术 ,包括 关联 性 分 析 、 分 类 分 析 、 偏 差 检测 等 。 由 此 可 
见 , 大 数据 侦查 的 每 一 个 阶段 都 需要 运用 到 专业 化 .智能 化 的 大 数据 相关 
技术 。 这 些 智能 化 技术 的 运用 ,不 仅 提高 了 侦查 工作 的 准确 性 ,加 快 案件 
侦破 的 进度 ;同时 也 大 大 解放 了 传统 侦查 中 的 人 力 劳 动 、 人 海战 术 , 推 动 了 
侦查 领域 生产 力 的 解放 。 

(三 ) 侦查 思维 的 相关 性 

侦查 活动 实际 上 就 是 一 个 重 构 犯 罪 的 过 程 ,侦查 人 员 根 据 犯 罪行 为 所 
留 下 的 痕迹 线索 及 证 据 ,逐渐 回 溯 性 地 去 还 原 犯 罪 事实 的 过 程 。 其 中 , 犯 
罪行 为 是 “ 因 ”, 犯 罪 现 场所 遗留 的 线索 .证 据 是 “ 果 ”, 侦 查 活动 就 是 由 果 及 
因 、 以 果 溯 因 的 过 程 ,是 一 个 不 断 假设 、 验 证 .再 假设 .再 验证 的 过 程 ,遵循 
人 类 一 直 以 来 的 因果 关系 思考 模式 。 如 侦查 人 员 在 现场 发 现 一 枚 指 印 ,猜测 
其 是 犯罪 分 子 所 留 ,并 通过 指纹 鉴定 、 比 对 技术 ,发 现 果然 与 公安 机 关 数 据 库 
中 的 犯罪 分 子 指纹 相 吻 合 , 这 便 是 一 个 由 假设 到 验证 的 因果 思维 过 程 。 


51] 王 宁 :《 知 道 吗 ? 我 们 原来 生活 在 “数字 阴影 "和 “平行 宇宙 ”中 》( 非 出 版 物 ) ,北京 ,2016 
年 新 经 济 智库 大 会 的 发 言 内 容 。 
C52] 李 学 龙 ,克海 刚 :( 大 数据 系统 综述 ), 载 (中 国 科 学 : 信息 科学 》,2015(1)。 
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而 大 数据 最 典型 的 思维 特征 是 “相关 性 ”, 将 事物 ,行为 转化 为 数据 , 通 
过 数据 运算 来 发 现 各 要 素 之 间 有 无 相关 性 。 大 数据 只 发 掘 事 物 之 间 有 无 
相关 性 ,而 不 去 探寻 它们 之 间 为 什么 有 关系 , 即 “ 知 其 然而 不 知 其 所 以 然 ”。 
这 种 方式 耗 时 少 、 成 本 小 , 相 比 于 人 类 的 主观 分 析 , 数 据 得 出 的 结果 也 更 具 
有 客观 性 和 说 服 力 。 大 数据 的 相关 性 思维 同样 会 对 侦查 活动 产生 影响 , 侦 
查 人 员 通 过 对 虚拟 空间 的 数据 进行 碰撞 、 挖 气 , 会 发 现 大 量 数据 间 的 相关 
关系 ,从 而 为 侦查 提供 线索 。 但 是 ,机 器 的 数理 逻辑 与 人 类 的 主观 经 验 逻 
辑 毕 竞 不 同 , 有 些 数据 相关 性 能 够 进行 因果 解释 ,而 有 些 数 据 的 相关 性 则 
无 法 找到 因果 解释 。 因 此 ,侦查 人 员 还 需要 运用 传统 侦查 经 验 ,对 大 数据 
所 提供 的 “数据 线索 ”进一步 分 析 和 验证 。 不 过 无 论 如 何 , 大 数据 的 相关 性 
思维 都 为 侦查 活动 打开 了 新 的 思维 视角 。 


三 、 大 数据 侦查 与 技术 侦查 \ 侦 查 技术 


在 侦查 学 中 ,侦查 技术 和 技术 侦查 是 一 对 容易 混淆 的 概念 。 在 大 数据 
技术 进入 侦查 领域 后 ,有 人 认为 其 是 一 种 侦查 技术 ,也 有 人 认为 是 技术 侦 
查 。 那 么 大 数据 侦查 究竟 属于 侦查 技术 还 是 技术 侦查 呢 , 大 数据 侦查 与 这 
两 者 之 间 又 有 怎样 的 关系 呢 ? 

(一 ) 大 数据 侦查 与 技术 侦查 

技术 侦查 是 指 侦查 机 关 针 对 某 些 类 型 的 犯罪 ,在 秘密 的 情况 下 所 采取 
的 具有 一 定 科 学 性 技术 性 的 侦查 措施 。 722 2012 年 (刑事 诉讼 法 》 修 改 时 
正式 赋予 了 技术 侦查 的 法 定 地 位 《刑事 诉讼 法 ?第 二 章 第 八 节 专门 规定 了 
技术 侦查 措施 的 相关 规定 。 技 术 侦 查 具 有 以 下 特征 : 一 是 技术 性 ,技术 侦 
查 需要 借助 一 定 的 科学 技术 手段 ,如 电子 监听 ,监控 等 ,不 包括 传统 利用 人 
力 的 跟踪 ,监视 等 措施 :二 是 秘密 性 ,技术 侦查 强调 秘密 性 ,不 能 让 犯罪 嫌 
疑 人 有 所 察觉 ;三 是 技术 侦查 针对 的 是 尚未 实施 或 正在 实施 的 行为 ,只 有 
尚未 完成 的 违法 犯罪 行为 才 具 有 实施 技术 侦查 的 必要 ;四 是 技术 侦查 一 般 


C51) 张 慧 明 :《 技 术 侦查 相关 概念 辨析 》, 载 (中 国 刑警 学 院 学 报 》,2012(4) 。 
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会 对 公民 的 隐私 权 、 通 讯 自由 等 权利 造成 侵害 .5 

大 数据 侦查 与 技术 侦查 在 运用 范围 ,程序 规定 、 技 术 内 容 等 方面 都 有 
所 不 同 。 首 先 ,二 者 的 运用 范围 不 同 。 根 据 刑 事 诉讼 法 的 相关 规定 ,技术 
侦查 只 能 运用 于 危害 国家 安全 犯罪 、 灵 怖 活动 犯罪 等 几 类 法 定 的 犯罪 活动 
中 ;而 大 数据 侦查 的 运用 则 没有 案件 种 类 的 要 求 。 其 次 ,二 者 的 程序 规定 
不 同 。 技 术 侦查 由 于 涉及 公民 的 重要 权利 ,需要 履行 严格 的 审批 程序 ; 而 
大 数据 侦查 一 般 程 序 要 求 没有 技术 侦查 严格 。 最 后 ,二 者 的 技术 内 容 也 不 
同 。 技 术 侦查 一 般 是 指 电话 监听 、` 网 络 监控 , 密 拍 .技术 定位 等 技术 ;而 大 
数据 侦查 则 重点 强调 数据 分 析 处 理 技术 。 

然而 ,大 数据 侦查 与 技术 侦查 也 有 交叉 之 处 。 技 术 侦 查 中 可 能 会 运用 
到 大 数据 侦查 方法 ,大 数据 时 代 完 全 可 以 将 一 些 大 数据 技术 吸收 至 传统 的 
技术 侦查 措施 中 去 ;部 分 大 数据 侦查 也 可 能 会 涉及 技术 侦查 程序 。 不 过 ， 
大 数据 侦查 本 身 是 中 立 的 ,被 纳入 技术 侦查 范畴 的 大 数据 侦查 措施 并 非 由 
于 其 技术 特征 ,主要 还 是 缘 于 其 使 用 方式 和 使 用 情境 。 尤 其 是 针对 尚未 发 
生 的 或 即将 发 生 的 犯罪 行为 ,需要 采取 秘密 的 “大 数据 监控 ?方式 去 获取 嫌 
疑 人 相关 数据 的 情境 。 例 如 在 一 些 恐 怖 活动 犯罪 毒品 犯罪 中 ,为 了 不 打 
草 惊 蛇 .全面 掌握 犯罪 事实 ,侦查 人 员 会 对 嫌疑 人 的 银行 账户 数据 、 话 单 
数据 .社交 网 站 数据 .即时 通讯 数据 等 进行 秘密 监控 ,并 通过 关联 关系 、 异 
常 分 析 等 数据 挖掘 技术 来 寻找 数据 背后 的 规律 ,从 而 及 时 发 现 相 关 犯 罪 
线索 。 对 于 技术 侦查 情境 下 的 大 数据 侦查 ,应 当 根据 4 刑事 诉讼 法 》 第 
148 一 150 条 的 规定 来 进行 规制 。 


技术 侦查 大 数据 侦查 


图 2-4 技术 侦查 与 大 数据 侦查 


51] 雇 斌 , 张 中 :《 技 术 侦 查 规范 化 研究 ),3 一 5 页 ,北京 ,法律 出 版 社 ,2015。 
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(二 ) 大 数据 侦查 与 侦查 技术 

侦查 技术 并 不 是 个 法 定 的 术语 ,在 学 理 界 ,侦查 技术 强调 侦查 机 关 在 
刑事 侦查 中 对 科学 技术 的 运用 , 既 包 括 传统 的 物理 取证 、 检 验 等 技术 ,也 包 
括 随 着 信息 化 发 展 而 产生 的 电子 取证 技术 .信息 化 取证 等 .1 六 侦查 技术 ” 
还 有 广义 和 狭义 之 分 。 从 狭义 上 来 说 , 侦查 技术 不 包括 具有 秘密 性 的 技术 
侦查 措施 ,而 是 特 指 公 开 的 侦查 技术 手段 ,如 电子 取证 技术 .视频 技术 、 测 
谎 技术 等 ;从 广义 上 讲 , 侦 查 中 凡是 采取 科学 技术 方法 .知识 的 措施 都 属 
于 侦查 技术 范畴 ,包括 上 文 提 到 的 “技术 侦查 ?措施 ,本 书 语 境 中 即 选取 广 
义 的 侦查 技术 概念 。 

大 数据 侦查 与 侦查 技术 是 从 属 关系 ,大 数据 侦查 属于 侦查 技术 范畴 。 
大 数据 侦查 中 最 核心 的 部 分 就 是 大 数据 技术 的 运用 ,无 论 是 数据 的 收集 、 
存储 还 是 数据 分 析 、 数 据 旦 现 都 离 不 开 专 业 的 大 数据 技术 。 大 数据 技术 依 
托 于 现代 的 网 络 通讯 技术 、 传 感 技术 、 数 据 库 技术 .数据 挖掘 技术 .人 工 智 
能 等 一 系列 复杂 的 科学 技术 体系 。 常 见 的 大 数据 侦查 方法 有 数据 搜索 、 数 
据 碰撞 、 数 据 挖掘 .犯罪 网 络 关 系 分 析 ` 数 据 画 像 等 ,它们 都 属于 侦查 技术 
的 范畴 。 相 比 于 传统 的 勘 验 技术 ,鉴定 技术 等 ,大 数据 侦查 技术 毫 不 逊色 。 
因而 从 广义 上 来 说 ,大 数据 侦查 属于 侦查 技术 范畴 。 





图 2-5 侦查 技术 与 大 数据 侦查 


51] 张 慧 明 :《 技 术 侦查 相关 概念 辨析 》, 载 (中 国 刑警 学 院 学 报 》,2012(4) 。 
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、 大 数据 侦查 与 信息 化 侦查 情报 导 侦 


随 着 大 数据 技术 在 侦查 中 的 运用 ,不 少 学 者 也 提出 大 数据 侦查 与 我 们 
常 说 的 的 情报 导 侦 、 信 息 化 侦查 之 间 是 怎样 关系 的 疑问 。 在 本 书 语 境 下 ， 
笔者 认为 大 数据 侦查 与 情报 导 侦 、 信 息 化 侦查 是 不 同 的 概念 ,但 是 它们 之 
间 又 有 着 密 不 可 分 的 联系 。 

(一 ) 大 数据 侦查 与 情报 导 侦 

情报 就 是 人 与 人 之 间 信 息 的 传递 ,是 伴随 着 人 类 社会 产生 和 发 展 的 一 
种 古老 现象 。 随 着 人 类 传播 媒介 的 发 展 ,情报 逐渐 从 肢体 动作 ,语言 .书面 
文字 发 展 到 现代 的 网 络 和 无 线 通信 等 传递 方式 。 顾 名 思 义 ,情报 导 侦 就 是 
强调 人 类 的 “情报 思维 ”在 侦查 中 的 运用 。 自 从 新 中 国 成 立 之 后 ,我 国情 报 
导 侦 工作 就 开始 起 步 ,发 展 ,情报 导 侦 是 指 侦查 机 关 对 侦查 中 的 各 种 证 据 、 
资料 线索 等 情报 的 获取 ,并 对 其 进行 分 析 研 判 ,从 而 为 刑事 侦查 .犯罪 预 
防 等 工作 提供 指导 和 方向 。 随 着 信息 技术 的 发 展 , 情 报导 侦 也 逐渐 从 有 了 形 
的 物理 空 间 的 情报 ,如 人 身 痕迹 特征 .痕迹 物证 .作案 工具 等 信息 ,发 展 到 
无 形 的 .虚拟 空间 的 情报 ,如 各 种 数据 库 信 息 `. 电 子 数据 信息 等 。 情 报导 侦 
的 外 延 包括 与 侦查 工作 有 关 的 各 种 信息 ,内 涵 主 要 强调 对 情报 信息 的 分 
析 、 研 判 , 将 情报 信息 转化 为 有 用 的 知识 ,1 随 着 情报 导 侦 工 作 的 开展 , 情 
报 不 仅仅 局 限于 对 个 案 的 侦破 ,还 可 以 通过 对 不 同时 期 犯罪 情报 的 汇总 、 
分 析 , 总 结 归纳 犯罪 规律 和 特点 ,为 未 来 犯罪 活动 的 预测 提供 信息 。5?7 

情报 导 侦 与 大 数据 侦查 既 有 区 别 又 有 联系 。 就 区 别 而 言 ,首先 ,二 者 
的 侧重 点 不 同 。 情 报导 侦 的 核心 在 于 对 情报 信息 的 分 析 、 研 判 ;而 大 数据 
侦查 不 仅 强调 对 数据 的 分 析 , 同 时 更 强调 数据 分 析 的 技术 、 方 法 与 思维 。 
其 次 ,二 者 的 载体 不 同 。 情 报导 侦 的 载体 是 情报 资料 ,其 具体 以 何 种 方式 
所 呈现 则 没有 要 求 ; 而 大 数据 侦查 的 载体 则 是 可 供 分 析 计 算 的 数据 。 最 
后 ,二 者 的 分 析 方 法 不 同 。 情 报导 侦 既 可 以 是 人 为 的 主观 经 验 分 析 , 也 可 


51] 彭 之 辉 :《 关 于 公安 情报 概念 的 理解 》, 载 (公安 学 刊 ),2007(1) 。 
52] 任 惠 华 主编 :《 侦 查 学 演讲 录 》,265、292 页 ,北京 ,法律 出 版 社 ,2010。 
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以 是 计算 机 等 机 器 进行 的 分 析 ; 而 大 数据 侦查 则 主要 运用 计算 机 来 进行 分 
析 处 理 。 不 过 ,情报 导 侦 和 大 数据 侦查 也 有 相 联 系 之 处 。 二 者 都 强调 对 初 
始 情报 资料 .原始 数据 的 加 工分 析 , 强 调 通过 寻找 规律 来 对 未 来 犯罪 进行 
预测 。 

人 类 每 一 次 的 技术 革命 都 为 情报 导 侦 注入 了 新 的 发 展 动力 ,在 当前 大 
数据 的 革命 浪潮 下 ,大 数据 技术 .大 数据 思维 方式 不 可 避免 地 对 传统 的 情 
报导 侦 产 生 影 响 , 情 报导 侦 在 内 容 、 传 递 和 分 析 方式 上 将 朝 着 纵深 方向 进 
一 步 发 展 。 

(二 ) 大 数据 侦查 与 信息 化 侦查 

“信息 化 ”一 词 起 源 于 20 世纪 60 年 代 的 日 本 。 自 八 九 十 年 代 开始 ,我 
国 各 个 领域 开始 受到 信息 化 技术 的 冲击 ,侦查 领域 自然 也 不 例外 。 信 息 化 
侦查 就 是 随 着 信息 化 技术 的 发 展 而 出 现 的 侦查 模式 。 从 公安 部 第 一 代 “ 金 
盾 工 程 ” 的 建设 开始 ,我 国 的 侦查 领域 便 开启 了 信息 化 的 历程 。 信 息 化 个 
查 以 “信息 ”(information) 作 为 主要 内 容 , 依 托 计算 机 技术 、 网 络 技 术 , 收 集 
和 挖掘 虚拟 空间 的 各 种 信息 ,用 于 案件 侦破 工作 。 相 比 于 传统 的 人 证 、 物 
证 等 物理 空间 的 侦查 方式 而 言 ,信息 化 侦查 主要 强调 信息 化 技术 对 于 侦查 
工作 方式 带 来 的 影响 和 变革 。") 

那么 ,大 数据 侦查 与 信息 化 侦查 之 间 的 关系 是 怎样 的 呢 ? 从 名 称 上 
看 ,二 者 是 不 同 的 概念 ;但 也 有 人 怀疑 论 者 认为 大 数据 侦查 与 信息 化 侦查 只 
是 名 称 的 不 同 而 已 ,并 没有 实质 的 差异 ;还 有 学 者 认为 信息 化 侦查 由 业务 
信息 主导 的 侦查 模式 和 大 数据 驱动 的 侦查 模式 组 成 ,大 数据 侦查 是 信息 化 
侦查 的 组 成 部 分 "? 笔者 认为 ,大 数据 侦查 是 信息 化 侦查 的 组 成 部 分 ,是 
信息 化 侦查 在 当今 时 代 的 体现 。 信 息 化 侦查 本 质 上 就 是 强调 信息 技术 对 
于 侦查 工作 的 影响 ,而 大 数据 恰恰 是 信息 化 技术 在 当前 发 展 的 体现 ,因而 
大 数据 侦查 也 是 时 代 背 景 下 信息 化 侦查 的 必然 发 展 阶段 。 


51] 陈刚 :《 信 息 化 侦查 教程 ),2、13 页 ,北京 ,中 国人 民 公安 大 学 出 版 社 ,2012。 
52] 何 军 :《 大 数据 与 侦查 模式 变革 研究 》, 载 (中 国人 民 公 安 大 学 学 报 》( 社 会 科学 版 ) ， 
2015(1) 。 
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不 过 ,就 以 往 信息 化 侦查 而 言 , 大 数据 侦查 在 侧重 点 .技术 特征 方面 也 
与 其 有 所 不 同 。 信 息 化 侦查 的 侧重 点 在 于 强调 侦查 工作 中 对 于 信息 技术 
的 运用 ;而 大 数据 侦查 中 除了 运用 专业 技术 外 ,还 强调 其 特有 的 大 数据 思 
维 , 以 及 大 数据 侦查 的 模式 。 信 息 化 侦查 中 所 涉及 的 技术 主要 包括 计算 
机 、 信 息 网 络 .通讯 等 ;而 大 数据 侦查 中 还 涉及 数据 处 理 ` 人 工 智 能 .神经 网 
络 等 新 的 技术 。" 

(三 ) 大 数据 侦查 的 传承 与 发 展 

大 数据 侦查 并 非 一 趴 而 就 的 新 事物 ,也 不 是 与 情报 导 侦 、 信 息 化 侦查 
完全 相对 的 概念 ,而 是 随 着 大 数据 技术 的 出 现 ,在 已 有 的 情报 导 侦 、 信 息 化 
侦查 基础 上 发 展 而 来 ,是 对 传统 情报 导 侦 、 信 息 化 侦查 的 传承 和 发 展 。“ 传 
承 ” 强 调 信息 化 侦查 、 情 报导 侦 已 有 的 建树 为 大 数据 侦查 所 提供 的 基础 ， 
“发 展 " 强 调 大 数据 侦查 对 信息 化 侦查 ,情报 导 侦 的 推进 作用 。 

大 数据 侦查 对 传统 情报 导 侦 、 信 息 化 侦查 的 传承 主要 体现 在 以 下 两 个 
方面 。(1) 多 年 来 的 信息 化 侦查 建设 为 大 数据 侦查 提供 了 丰富 的 数据 源 。 
公安 机 关 基于 其 治安 管理 及 打击 犯罪 等 职务 需求 ,对 一 些 社会 基本 数据 以 
及 与 公安 业务 有 关 的 数据 进行 收集 、 整 理 ,并 逐步 建立 了 不 同 主题 的 数据 
库 。 例 如 2003 年 我 国 公安 启动 了 “金盾 工程 ”任务 ,建立 公安 机 关 的 通信 
工程 和 网 络 工程 ,建成 了 全 国 范 围 的 八大 基础 信息 库 ;在 此 基础 上 ,金盾 工 
程 第 二 ,第 三 期 又 继续 深入 开展 ,致力 于 数据 库 之 间 的 共享 以 及 数据 综合 
应 用 平台 等 建设 工作 。 检 察 机 关 的 信息 化 建设 也 开始 蓬勃 发 展 ,已 经 有 不 
少 检察 机 关 的 职务 犯罪 侦查 部 门 开 始 组 建 数据 库 , 例 如 某 市 检察 系统 建立 
有 “情报 信息 平台 ”, 包 括 人 大 代表 信息 、 政 协 委员 信息 、 律 师 信息 、 婚 姻 信 
息 \ 殡 车 火化 信息 、 工 商 登 记 信 息 、 基 本 生活 救助 信息 、 企 业 纳税 信息 、 个 人 
所 得 税 信息 、 房 屋 登 记 人 信息、 住房 公 积 金 信息 、 出 租房 屋 信 息 、 通 讯 信息 、 手 


51] 笔者 认为 ,从 本 质 上 来 说 ,情报 导 侦 的 核心 在 于 对 情报 的 分 析 研 判 ,分 析 结 果 才 是 有 价 
值 的 情报 ;信息 化 侦查 的 核心 在 于 信息 技术 的 运用 .并 没有 过 多 强调 对 信息 进行 加 工 研判 ;而 大 数 
据 侦查 不 仅 强调 对 数据 的 分 析 处 理 , 也 强调 数据 分 析 结 果 以 及 大 数据 特有 思维 的 运用 。 这 三 者 之 
间 侧 重点 的 不 同 是 它们 进行 比较 的 基础 。 
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机 信息 ,等 等 。 这 些 随 着 信息 化 侦查 发 展 而 建立 起 来 的 数据 库 , 为 大 数据 
侦查 提供 了 基础 的 数据 资源 。(2) 情 报导 侦 的 分 析 研 判 思维 为 大 数据 侦查 
奠定 了 思维 模式 基础 。 情 报导 侦 的 核心 就 在 于 对 已 收集 到 的 情报 信息 进 
行 分 析 、 人 研判 ,找到 零散 犯罪 情报 背后 的 规律 ,特点 ,将 研判 分 析 后 的 “情报 
成 果 ” 用 于 辅助 侦查 工作 。 这 一 思维 模式 与 大 数据 侦查 的 思维 不 谋 而 合 。 
大 数据 侦查 通过 数据 挖掘 .数据 二 次 分 析 来 获取 有 关 侦 查 信息 ,强调 通过 
历史 犯罪 数据 的 分 析 来 提炼 犯罪 规律 、 犯 罪 特征 ,并 对 未 来 犯罪 进行 预测 。 
大 数据 侦查 思维 与 情报 导 侦 思维 极 具 相 似 性 ,大 数据 侦查 思维 的 运用 离 不 
开 传 统 情报 导 侦 长 期 以 来 所 总 结 的 分 析 研 判 原理 、 方 法 和 经 验 。 

大 数据 侦查 对 传统 情报 导 侦 、 信 息 化 侦查 的 发 展 主要 体现 在 以 下 两 个 
方面 。(1) 侦 查 载 体 、 侦 查 媒 介 的 突破 。 无 论 是 情报 导 侦 、 信 息 化 侦查 还 是 
大 数据 侦查 ,都 需要 某 种 载体 媒介 去 传递 信息 ,侦查 人 员 根 据 所 传递 的 信 
息 去 还 原 犯 罪 事实 。 在 情报 导 侦 的 发 展 过 程 中 , 侦查 媒介 逐渐 从 有 形 的 物 
证 ,书证 发 展 到 无 形 的 虚拟 空间 的 情报 ;信息 化 侦查 的 媒介 是 以 电子 形态 
所 呈现 的 电子 信息 。 大 数据 侦查 则 是 将 “数据 ”作为 侦查 媒介 来 传递 信息 。 
“数据 ”作为 一 种 全 新 的 载体 和 媒介 , 比 传统 的 情报 \ 信 息 的 粒度 更 加 细 化 。 
尽管 数据 多 半 是 以 电子 化 、 虚 拟 化 形式 所 存在 ,但 大 数据 侦查 所 关注 的 重 
点 并 不 在 于 数据 的 形式 ,而 是 强调 数据 所 拥有 的 独立 内 涵 。 正 如 量子 的 发 
现 带 来 了 物理 学 上 的 革命 数据? 也 带 来 了 侦查 领域 的 革命 ,侦查 信息 的 
发 现 . 收 集 存储 和 分 析 都 能 以 数据 为 媒介 来 进行 。(2) 侦 查 信息 分 析 方 法 
的 突破 。 无 论 是 情报 导 侦 .信息 化 侦查 还 是 大 数据 侦查 ,对 于 所 获取 的 第 
一 手 线索 .信息 都 需要 经 过 一 定 的 分 析 、` 判 断 。 传 统 信息 化 侦查 中 更 为 强 
调 对 电子 信息 的 获取 ,而 信息 的 分 析 、 研 判 则 不 作为 重点 ,一般 辅 之 以 简单 
的 信息 查询 检索 方法 。 在 情报 导 侦 中 ,尽管 情报 的 分 析 、 研 判 是 重点 工 
作 , 但 是 由 于 过 去 情报 分 析 技 术 的 不 发 达 , 很 多 时 候 都 需要 靠 侦 查 人 员 的 
主观 经 验 分 析 判 断 , 不 仅 耗 费 劳动 力 ,对 于 一 些 深度 隐藏 的 犯罪 规律 ,如 犯 
罪 分 子 的 作案 手段 特征 、 习 性 规律 ,作案 时 间 地 点 等 特征 根本 难以 发 现 。 
大 数据 侦查 对 于 信息 的 分 析 、 研 判 水 平 则 有 了 新 的 突破 。 大 数据 强调 盘活 
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沉睡 的 数据 资源 ,打破 各 个 部 门 之 间 的 信息 孤岛 ,通过 海量 数据 之 间 的 串 
并 、 磁 撞 来 发 现 线索 和 证 据 ; 更 重要 的 是 ,大 数据 侦查 能 够 对 数据 进行 二 次 
利用 和 深度 分 析 ,通过 数据 挖掘 技术 对 海量 的 犯罪 数据 进行 分 析 , 发 现 犯 
罪 现象 背后 的 行为 规律 ,特征 等 深层 次 信息 。 


五 、 大 数据 在 侦查 中 的 运用 形式 


目前 在 侦查 实务 中 ,大 数据 侦查 中 的 数据 分 析 结 果 究 竞 是 以 怎样 的 形 
式 所 呈现 .运用 的 呢 ? 据 侦 查实 务 人 员 反 映 ,目前 他 们 主要 将 大 数据 分 析 
结果 作为 线索 来 使 用 。 但 笔者 认为 ,除了 用 作 线 索 外 ,大 数据 在 将 来 有 可 
能 会 成 为 一 种 新 的 证 据 形 式 。 

(一 ) 大 数据 侦查 之 线索 运用 形式 

线索 是 侦查 中 用 于 查 明 案 件 事实 ,收集 证 据 不 可 或 缺 的 媒介 ,对 线索 
的 正确 运用 能 够 有 效 推进 案件 的 侦破 进程 .72 在 案件 的 侦查 过 程 中 ,会 出 
现 大 量 线索 ,有 些 线索 是 真实 的 ,有 些 线索 是 虚假 的 ;有 些 线索 与 案件 联系 
紧密 直观 ,而 有 些 线索 与 案件 的 联系 具有 间接 性 。 查 明 案 件 事 实 的 过 程 ， 
就 是 不 断 地 通过 线索 去 查找 新 的 线索 、 证 据 , 通 过 对 大 量 线索 的 梳理 逐渐 
还 原案 件 事 实 , 不 断 地 缩小 案件 侦查 范围 。?” 

一 般 来 说 ,线索 没有 严格 的 形式 要 求 ,运用 程序 灵活 方便 。 在 大 数据 
侦查 尚未 成 熟 时 期 ,将 大 数据 分 析 结 果 作为 线索 使 用 ,是 较为 稳妥 的 选择 。 
据 实务 人 员 反 映 ,目前 大 数据 在 侦查 中 最 主要 的 形式 就 是 作为 线索 使 用 。 
在 传统 的 犯罪 侦查 中 ,线索 带 有 小 数据 时 代 的 印记 ,往往 局 限于 物理 空间 
的 物品 .痕迹 以 及 人 类 的 印象 .言词 等 。 随 着 人 类 科学 技术 的 发 展 , 线 索 
的 范围 和 形式 也 在 不 断 扩 张 。 大 数据 时 代 , 传 统 物理 空间 的 线索 在 数据 
空间 往往 有 着 对 应 的 形式 ,数据 空间 甚至 能 够 提供 更 多 物理 空间 无 法 显 
现 的 线索 。 具体 而 言 , 大 数据 侦查 结果 作为 线索 运用 主要 体现 在 以 下 两 


C51) 薛 怀 祖 :《 浅 议 侦查 线索 的 显现 与 价值 体现 》, 载 (铁道 警官 高 等 专科 学 校 学 报 》， 
2003(4) 。 
52] 分 荣 合 :《 论 侦查 线索 的 分 类 》, 载 (公安 学 刊 ),2000(2)。 
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个 方面 。 

一 是 “从 案件 到 线索 ”。 在 案件 发 生 之 后 ,通过 大 数据 方法 去 搜集 与 案 
件 有 关 的 线索 。 由 于 仅仅 是 作为 线索 使 用 ,所 以 对 于 大 数据 方法 的 运用 及 
数据 本 身 的 形态 并 没有 严格 的 法 律 规定 。 可 以 运用 大 数据 方法 找到 与 案 
件 或 嫌疑 人 之 间 直 接 相关 的 线索 ,例如 知道 嫌疑 人 的 身份 后 ,可 以 在 基本 
人 口 数据 库 .在 逃 人 员 数 据 库 .前 科 人 员 数 据 库 中 搜集 与 他 直接 相关 的 信 
息 。 另 外 ,还 可 以 通过 数据 挖掘 技术 ,挖掘 出 与 案件 相关 的 线索 ,例如 有 
关 嫌疑 人 性 格 特征 ,行为 偏好 人际 关 系 等 方面 的 信息 。 尽 管 有 些 数据 与 
案 或 人 之 间 的 关系 并 非 那么 紧密 ,但 是 能 够 为 案件 侦破 提供 丰富 的 线索 。 

二 是 “从 线索 到 案件 ”。 在 不 知道 是 否 有 案件 发 生 的 时 候 , 侦 查 人 员 
能 够 通过 大 数据 识别 .预测 技术 来 直接 发 现 某 种 犯罪 活动 的 线索 。“ 从 线 
索 到 案件 ?这 一 方式 尤其 在 证 券 欺 诈 犯 罪 .丽人 怖 活动 犯罪 .贪污 贿赂 犯罪 
等 隐蔽 性 较 强 的 犯罪 活动 中 具有 广阔 运用 空间 ,例如 侦查 人 员 可 以 运用 
大 数据 技术 来 抓 取 信用 卡 欺诈 犯罪 的 线索 一 一 分 析 海 量 用 户 的 历史 交易 
数据 ,通过 孤立 点 和 相 异 度 计算 所 得 出 的 异类 数据 很 有 可 能 就 是 犯罪 活 
动 的 信号 ;再 如 某 市 检察 院 其 利用 大 数据 算法 将 涉 税 犯罪 的 规律 转化 成 
数据 规则 ,并 将 其 投放 于 海量 的 各 单位 税 票数 据 中 ,从 而 发 现 涉 税 案件 的 
线索 。 

(二 ) 大 数据 侦查 之 证 据 运 用 形式 

人 类 的 科学 技术 革命 总 会 推动 证 据 形 式 的 发 展 。 证 据 作 为 案件 信息 
的 载体 ,无 不 与 人 类 历史 上 的 媒介 变革 息息相关 : 语言 对 应 着 言词 类 证 据 ， 
文字 和 印刷 术 对 应 着 书面 证 据 , 电 话 、 广 播 等 电磁 波 媒 介 则 对 应 着 视听 类 
证 据 , 而 近 些 年 的 计算 机 、 互 联网 媒介 则 催生 了 电子 数据 证 据 的 发 展 。 每 
一 次 媒介 革命 总 会 产生 新 的 证 据 形 式 ,证 据 形 式 的 扩展 也 推动 了 人 类 司法 
证 明 水 平 的 发 展 , 越 来 越 多 的 信息 得 以 被 记录 、 存 储 、 传 播 及 解读 。 那 么 ， 
大 数据 所 带 来 的 媒介 变革 ,是 否 也 会 再 次 推动 证 据 形 式 的 发 展 ,产生 “大 数 
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据 证 据 ? 这 一 新 的 证 据 形式 呢 72 

目前 在 刑事 犯罪 侦查 实务 中 “大 数据 ?主要 是 作为 犯罪 线索 来 使 用 ， 
将 大 数据 分 析 结果 直接 作为 证 据 使 用 的 案例 尚 不 多 见 。 但 这 并 不 表示 大 
数据 没有 证 据 价值 。 有 学 者 认为 , 随 着 大 数据 在 工作 生活 中 的 广泛 运用 ， 
它 确 有 在 诉讼 中 成 为 证 据 、 发 挥 证 明 效 力 的 可 能 性 ."* 笔者 认为 ,大 数据 
在 刑事 诉讼 中 具有 成 为 新 证 据 形 式 的 可 能 性 ,理由 有 以 下 两 个 方面 。 

第 一 ,部 分 “大 数据 线索 ”有 可 能 转化 为 “大 数据 证 据 *。 尽 管 从 字面 上 
看 ,线索 和 证 据 是 两 个 不 同 的 概念 一 一 线索 是 针对 侦查 阶段 而 言 ,而 证 据 
则 在 侦查 、 审 查 起 诉 和 审判 三 个 阶段 都 会 涉及 ;线索 没有 固定 的 形式 要 求 ， 
也 没有 收集 程序 上 的 严格 规定 ,一般 而 言 只 要 能 够 推进 侦查 工作 的 信息 都 
是 线索 ,而 证 据 则 需要 符合 法 定 的 形式 和 性 质 , 并 且 按 照 法 定 的 程序 去 收 
集 。 但 实际 上 ,线索 与 证 据 之 间 并 没有 严格 的 界限 。 对 于 证 明 犯 罪 事实 具 
有 重要 作用 并 经 查证 属实 的 线索 可 以 作为 定案 的 证 据 ,这 类 线索 也 被 称 
为 “证 据 性 线索 ”。"3 上 文 提 到 目前 大 数据 侦查 结果 主要 是 作为 线索 使 用 ， 
当 这 些 * 大 数据 线索 "能够 证 明 案件 事实 ,符合 证 据 属性 要 求 ,经 法 定 程序 
获取 , 即 有 可 能 成 为 定案 的 证 据 。 

第 二 ,在 民事 诉讼 和 行政 诉讼 中 ,都 已 经 出 现 了 将 “大 数据 ”作为 定案 
证 据 的 案例 。 在 “上 海 唯 觉 广告 有 限 公 司 与 被 告 上 海 盛 久 网 络 科技 发 展 有 
限 公 司 服务 合同 纠纷 案 ” 中 ,被 告 将 “百度 指数 ”作为 证 明 已 方 主张 的 证 据 。 
“百度 指数 ”是 大 数据 的 典型 代表 , 它 在 证 明 事物 的 网 络 关 注 度 、 发 展 趋势 
方面 有 一 定 的 说 服 力 。 本 案 中 法 院 认为 “由 于 被 告 提供 的 证 据 系 从 “百度 ” 





[1] 严格 来 说 ,大 数据 侦查 中 的 数据 分 析 结 果 有 两 种 形式 : 一 种 方式 是 通过 大 数据 技术 去 寻 
找 相关 数据 ,大 数据 并 没有 对 原本 的 数据 形态 进行 改变 ,对 于 这 类 数据 的 运用 可 以 参照 传统 的 电子 
数据 形式 ; 另 一 种 方式 是 通过 大 数据 技术 对 原本 数据 进行 分 析 , 产 生 了 新 的 数据 ,对 于 这 类 新 的 数 
据 能 否 作为 证 据 运 用 ,目前 尚 不 明朗 。 本 节 的 讨论 对 象 主 要 是 针对 后 者 。 关 于 这 两 种 大 数据 分 析 
结果 的 形式 ,后 面 章 节 还 会 进行 详细 分 析 。 

[2] Joe Sremack.”"Big Data Forensics-Learning Hadoop Investigations”, Packet Publishing 
Lted ,pl. 

53] 分 荣 合 :《 论 侦查 线索 的 分 类 》, 载 (公安 学 刊 ),2000(2)。 
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互联 网 中 直接 统计 得 出 , 且 经 过 公证 机 关公 证 ,被 告 的 证 据 优势 明显 ”。"7 
在 唐 某 某 与 中 国 证 监 会 行政 诉讼 一 案 中 ,法院 也 是 根据 大 数据 分 析 结 果 来 
认定 唐 某 某 存在 操纵 股票 价格 的 行为 。 大 数据 分 析 结 果 显 示 , 在 唐 某 某 涉 
案 的 19 个 账户 之 间 ,MAC 地 址 、IP 地 址 具有 高 度 重合 率 ,19 个 账户 中 所 
交易 的 股票 品种 也 存在 着 高 度 的 一 致 性 ,"*? 不 过 ,刑事 诉讼 中 的 证 明 标准 
以 及 证 明 程序 相 较 于 民事 诉讼 、 行 政 诉讼 要 更 为 严格 ,在 没有 相关 法 律 规 
定 和 司法 判例 指导 的 前 提 下 ,如 何 将 大 数据 的 特性 与 既 有 的 证 据 属 性 要 
求 .证据 规 则 进行 衔接 ,也 是 吸 待 解决 的 问题 。 笔 者 认为 , 随 着 大 数据 技术 
在 刑事 侦查 中 的 普及 ,大 数据 在 将 来 能 够 直接 作为 刑事 定案 的 证 据 。 





第 三 节 大 数据 侦查 的 价值 


本 书 之 所 以 提出 "大 数据 侦查 "概念 ,并 强调 在 侦查 实务 中 推广 大 数据 
技术 ,是 因为 大 数据 侦查 具有 传统 侦查 无 可 比拟 的 价值 ,能 够 有 效 地 提高 
侦查 效率 .节约 侦查 成 本 ,推动 侦查 模式 朝 着 科学 化 的 方向 转型 。 


一 、 推动 事 后 侦查 向 事前 侦查 转型 


长 久 以 来 ,人 类 基于 趋 利 避 害 的 生理 需求 ,都 期 望 能 够 先知 先觉 ,提前 
预知 社会 现象 。 试 想 , 如 果 能 够 提前 预知 疾病 和 灾难 的 发 生 , 人 类 的 生命 
健康 就 可 以 免 受 侵害 ; 如 果 能 够 提前 预知 天 象 气候 ,就 能 够 合理 安排 农 作 
物 耕 种 。 因 此 ,人 类 历朝 历代 无 不 致力 于 预测 能 力 的 提高 。 从 原始 社会 的 
神灵 预测 .古代 的 经 验 性 预测 ,发 展 到 近 现 代 的 哲理 性 预测 .实证 性 预 
测 ," 引 J 尽管 人 类 一 直 在 不 断 提升 预测 能 力 的 科学 性 ,但 始终 无 法 超越 主观 
认 知 能 力 的 局 限 性 ,预测 仍然 是 人 类 社会 的 未 解难 题 之 一 。 侦 查 领域 同样 
面 对 此 难题 ,由 于 犯罪 时 空 的 不 可 北 转 性 ,人 们 无 法 在 犯罪 活动 开始 之 前 


C1) 案件 字号 : (2014) 沪 二 中 民 五 ( 知 ) 终 字 第 67 号 。 
52] 案件 字号 : 北京 市 第 一 中 级 人 民法 院 行政 判决 书 ,(2013) 京 一 中 行 初 字 第 1171 号 。 
53] 韶 耀 军 :《 从 古代 龟 鞭 占卜 到 现代 科学 预测 》, 载 (湖北 社会 科学 ),2006(3) 。 
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就 预知 并 阻止 其 发 生 ,在 犯罪 行为 发 生 之 后 才能 采取 侦查 措施 。 从 程序 上 
来 说 ,事后 侦查 具有 一 定 的 合理 性 ,有 利于 防止 侦查 权力 的 滥用 ,保障 犯罪 
嫌疑 人 的 自由 、 民 主 等 人 权 。 但 是 ,犯罪 分 子 的 权利 与 公众 的 权利 是 对 立 
的 ,犯罪 分 子 权 利 的 保障 往往 以 民众 权利 的 牺牲 为 代价 。 事 后 侦查 的 时 空 
滞后 性 会 导致 民众 的 生命 .财产 、 健 康 等 权利 不 可 避免 地 遭受 侵害 。 

大 数据 的 核心 价值 就 在 于 预测 ,大 数据 技术 有 望 改变 传统 事后 侦查 的 
时 空 滞后 性 缺陷 。 掌 握 规律 是 进行 预测 的 前 提 和 基础 ,大 数据 能 够 快速 从 
海量 数据 中 发 掘 事物 的 规律 ,并 以 数据 化 形式 进行 表达 。 一 旦 大 数据 将 数 
据 规律 用 于 对 应 的 时 空 领域 , 预测 未 来 就 不 再 是 难题 。 目 前 ,大 数据 的 预 
测 功 能 已 经 在 很 多 领域 发 挥 作用 ,例如 购物 网 站 根据 顾客 的 喜好 来 推送 商 
品 , 社 交 网 络 根据 用 户 的 社交 活跃 度 来 推荐 好 友 , 大 数据 对 交通 的 预测 可 
以 令 我 们 避 开 拥堵 路 段 , 等 等 。 在 侦查 领域 ,大 数据 的 预测 功能 同样 具有 
广阔 的 运用 前 景 。 运 用 大 数据 挖掘 技术 ,对 海量 历史 犯罪 数据 进行 分 析 ， 
寻找 犯罪 因素 之 间 的 关联 性 ,总 结 各 类 型 犯罪 活动 规律 。 根 据 数据 分 析 结 
果 , 侦 查 人 员 能 够 预知 犯罪 活动 在 地 理 位 置 、 人 和 群 . 时 间 、 行 为 方式 等 方面 
的 趋势 ,及 时 发 现 可 疑犯 罪 分 子 、 识 别 犯罪 风险 ,进而 合理 分 配 警 力 资源 ， 
采取 预防 性 措施 。 大 数据 预测 技术 在 侦查 领域 的 运用 ,能 够 引导 事后 侦查 
逐渐 向 事前 侦查 转型 ,这 对 于 减少 违法 犯罪 活动 ,保护 公民 的 人 身 、 财 产权 
利 , 维 护 国家 安全 、 社 会 秩序 具有 重大 意义 。 

目前 ,大 数据 主导 的 “预测 侦查 ”已 经 在 越 来 越 多 的 国家 开始 使 用 , 例 
如 美国 在 “9。 11” 事 件 后 建立 的 禁 飞 系统 (No Fly System) ,能 够 预测 搭乘 
飞机 的 旅客 是 否 有 发 起 恐怖 袭击 的 可 能 性 ;在 洛杉矶 ,大 数据 系统 每 天 会 
提供 给 警 员 一 幅 犯 罪 热点 地 图 ;在 纽约 和 费城 ,大 数据 系统 则 是 将 预测 数 
据 传输 到 警 员 的 移动 电子 设备 中 去 。"1) 


[1] See Kipperman,Alexander H.,“Frisky Business: Mitigating Predictive Crime Software’s 
Facilitation of Unlawful Stop and Frisks”, Temple Political & Civil Rights Law Review ,2014 ,pp. 
215-246. 
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二 、 推 动 被 动 侦查 向 主动 侦查 转型 


传统 的 侦查 是 在 单 维度 的 物理 空间 中 所 进行 的 ,在 这 种 单 维 空间 中 ， 
信息 是 以 原始 的 物理 化 形态 所 呈现 ,人 类 对 于 信息 的 存储 、 提 取 以 及 解读 
都 处 于 “ 冷 兵 器 * 时 代 。 对 于 犯罪 活动 的 记录 主要 依靠 物质 之 间 的 自然 交 
换 , 以 及 人 类 的 书面 语言 体系 、 人 类 的 记忆 能 力 等 。 物 证 ,书证 和 人 证 这 三 
种 古老 的 证 据 形式 就 是 这 一 阶段 的 产物 ,侦查 人 员 通 过 对 这 三 种 证 据 的 收 
集 , 并 依据 侦查 经 验 进行 犯罪 事实 的 还 原 。 由 于 传播 媒介 的 不 发 达 、 信 息 
的 不 流通 性 ,犯罪 活动 中 很 多 信息 都 无 法 留存 下 来 。 因 此 ,侦查 人 员 所 掌 
握 的 线索 .证 据 是 有 限 的 ,只 能 在 犯罪 事实 发 生 后 ,根据 特定 时 空 范围 内 有 
限 的 线索 .证据 来 对 案件 事实 进行 假设 性 还 原 。 然 而 ,并 非 所 有 的 案件 都 
能 够 收集 到 足够 的 线索 .证 据 , 很 多 案件 也 因为 证 据 不 足 而 导致 无 法 认定 ， 
甚至 造成 错案 。 长 久 以 来 ,在 侦查 对 抗 活动 中 ,都 是 犯罪 分 子 处 于 领跑 地 
位 ,而 侦查 人 员 则 处 于 被 动 的 地 位 。 

大 数据 技术 的 出 现 , 则 大 大 改变 了 传统 侦查 中 侦查 人 员 的 被 动 地 位 ， 
有 效 地 提高 其 在 侦查 中 的 主观 能 动 性 。 首 先 , 大 数据 提供 了 丰富 的 侦查 资 
源 。 在 大 数据 时 代 , 会 形成 一 个 与 现实 物理 世界 相对 应 的 数字 世界 ,以 数 
据 的 形式 记录 下 人 类 物理 空间 的 各 种 活动 和 状态 。 大 数据 不 仅 能 够 对 物 
理 空间 的 各 种 活动 状态 进行 数据 化 分 析 和 表达 ,还 能 够 将 其 长 期 保存 在 服 
务 器 及 “云端 "中 。 数 据 空间 无 疑 为 犯罪 侦查 打开 了 新 的 领域 ,任何 犯罪 行 
为 都 会 在 数据 空间 留 下 痕迹 ,侦查 人 员 可 以 在 数据 空间 寻找 对 应 的 数据 线 
索 和 证 据 。 其 次 ,大 数据 提供 了 强大 的 侦查 技术 。 大 数据 能 够 通过 数据 模 
型 算法 ,轻松 找 出 事物 之 间 的 关联 性 ,这 种 关联 性 分 析 方 法 为 人 类 认 知 世 
界 提供 了 新 的 视角 。 在 侦查 过 程 中 ,大 量 表面 看 似 与 案件 无 关 的 信息 , 通 
过 数据 碰撞 数据 挖掘 等 大 数据 方法 对 其 进行 整合 分 析 , 便 能 够 显现 出 诸 
多 与 案件 有 关 的 信息 ,为 案件 侦破 提供 线索 。 例 如 ,在 贪污 贿赂 案件 传统 
侦查 中 ,由 于 这 类 案件 具有 隐蔽 性 ,也 没有 犯罪 现场 ,因此 传统 侦查 中 主要 
靠 嫌 疑 人 的 口供 去 固定 犯罪 事实 ;在 大 数据 技术 的 帮助 下 ,侦查 人 员 可 以 
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摆脱 对 口供 的 依赖 ,通过 对 嫌疑 人 的 手机 数据 .通话 数据 .银行 流水 数据 等 
进行 大 数据 分 析 , 通 过 客观 的 数据 来 发 现 、 固 定案 件 事实 。 


三 、 推 动 单线 侦查 向 协作 侦查 转型 


在 以 往 的 信息 化 侦查 中 ,一 般 都 是 由 各 个 部 门 单 兵 作战 .单线 侦查 ,所 
运用 的 数据 信息 也 大 都 来 源 于 自己 的 部 门 。 不 同 地 区 ,不同 级 别 . 不 同 警 
种 之 间 的 数据 都 互相 保密 , 互 不 开放 ,存在 着 严重 的 数据 壁垒 。 只 有 在 必 
要 的 时 候 ,才能 够 得 到 其 他 部 门 在 数据 资源 方面 的 协助 。 例 如 在 贪污 贿赂 
案件 中 ,检察 机 关 数 据 库 相 对 匮乏 ,往往 需要 借助 公安 机 关 强 大 的 数据 库 
以 及 社会 行业 的 数据 库 资源 ,尤其 是 电信 行业 的 通讯 数据 、 银 行 的 交易 转 
账 数据 等 。 这 种 动 辑 向 其 他 部 门 " 借 ?数据 的 方式 不 仅 程序 烦琐 ,浪费 大 量 
的 时 间 . 人 力 、 物 力 ,往往 还 延误 了 最 佳 侦查 时 机 。 和 总 之 ,长 久 以 来 的 信息 
化 侦查 是 一 种 单线 侦查 . 单 兵 作战 模式 ,各 侦查 部 门 所 掌握 的 数据 量 有 限 ， 
无 法 激发 出 数据 背后 的 价值 。 

大 数据 侦查 机 制 的 建立 , 必 将 有 助 于 推动 单线 侦查 模式 朝 着 以 下 两 个 
方面 改革 : (1) 大 数据 侦查 机 制 会 推动 数据 管理 制度 数据 共享 制度 的 变 
化 。 在 数据 管理 层面 ,侦查 系统 内 部 的 数据 资源 要 开放 共享 ,打破 地 域 、 级 
别 之 间 的 数据 壁垒, 侦查 部 门 与 社会 行业 之 间 也 应 当 建 立 数据 协作 共享 机 
制 ,建立 数据 开放 渠道 ,最 大 程度 上 开放 数据 资源 ,为 大 数据 侦查 的 开展 提 
供 丰 富 数 据 资源 。(2) 数 据 共享 机 制 的 建立 又 会 进一步 推动 侦查 体制 的 变 
化 。 在 数据 共享 的 基础 上 ,各 侦查 部 门将 会 组 建 专门 的 数据 人 才 队 伍 ,以 
数据 为 核心 ,将 侦查 人 力 、 物 力 和 技术 资源 进行 整合 重组 。 某 种 程度 上 实 
现 *“ 大 警 种 制 ” 侦 查 一 体 化 ”的 制度 。 总 而 言 之 ,大 数据 侦查 必 将 推动 侦查 
体制 的 改革 ,从 传统 的 各 部 门 单线 作战 ,发 展 到 不 同 的 侦查 部 门 之 间 、 侦 查 
部 门 与 社会 行业 之 间 的 协助 作战 模式 。 





四 、 推动 粗放 式 侦查 向 集约 式 侦查 转型 
大 数据 运用 于 犯罪 侦查 ,有 利于 促进 传统 粗放 式 侦查 向 集约 式 侦查 的 
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转型 。 上 文 提 到 传统 的 侦查 模式 是 处 于 “ 冷 兵器 ”时 代 , 尽 管 后 来 的 信息 化 
侦查 已 经 使 传统 侦查 模式 从 冷 兵器 时 代 解 放出 来 ,侦查 人 员 在 物理 犯罪 现 
场 外 拓展 出 虚拟 犯罪 现场 ,开始 注重 电子 证 据 的 收集 。 但 是 ,大 数据 侦查 
在 此 基础 上 则 又 完成 了 智能 化 转型 ,进一步 解放 了 大 量 的 人 力 劳 动 ,从 粗 
放 型 . 撒 网 式 侦查 转向 集约 型 .科学 化 侦查 模式 。 具 体 而 言 表 现在 以 下 三 
个 方面 。 

(1) 数据 采集 环节 更 加 智能 化 .实时 化 。 侦 查 过 程 中 ,传统 的 信息 采集 
往往 依托 于 人 工 进行 事后 录入 ,不 仅 需要 大 量 的 人 力 劳动 ,也 造成 信息 传 
递 的 滞后 性 ,容易 延误 了 最 佳 侦查 时 机 。 而 在 大 数据 时 代 , 随 着 物 联网 的 
发 展 , 通 过 智能 传 感 、 射 频 识 别 等 技术 就 能 够 自动 完成 数据 采集 工作 ,解放 
了 大 量 劳 动力 ,大 大 地 扩展 了 数据 的 来 源 。 并 且 , 大 数据 时 代 的 数据 传输 
具有 实时 、 同 步 的 特征 ,保证 了 数据 的 鲜 活性 、 及 时 性 。 

(2) 数据 分 析 环 节 更 加 科学 化 、 多 元 化 。 传 统 的 信息 化 侦查 中 ,即便 是 
有 数据 资源 ,也 是 主要 依靠 侦查 人 员 的 经 验 型 主观 判断 ,并 辅 之 数据 查询 、 
数据 检索 等 简单 的 数据 分 析 工 具 。 但 人 的 分 析 能 力 毕 竟 是 有 限 的 , 面 对 庞 
杂 的 数据 ,很 多 隐藏 的 线索 .规律 根本 无 法 发 现 ; 并 且 随 着 当今 爆发 式 增长 
的 数据 , 仅 赁 人工 和 简单 的 数据 分 析 工 具 , 根 本 无 法 应 对 。 大 数据 方法 大 
大 解放 人 类 的 脑力 工作 ,通过 数据 碰撞 能 够 发 现 更 多 的 线索 ,通过 数据 挖 
掘 算法 能 够 自动 识别 出 数据 之 间 的 关联 性 ,发 掘 数据 背后 隐藏 的 信息 。 很 
多 看 似 无 关联 的 数据 ,经 过 大 数据 分 析 后 , 则 能 够 显现 出 很 多 有 价值 的 信 
息 用 于 辅助 侦查 。 大 数据 侦查 就 像 一 个 自动 化 的 工厂 流水 线 一 一 数据 是 
原料 ,算法 是 机 器 、 数 据 分 析 结 果 就 是 产品 。 总 之 , 相 比 于 传统 的 表格 化 、 
人 工 经 验 型 信息 分 析 方 法 ,大 数据 侦查 方法 大 大 拓展 了 数据 分 析 的 广度 和 
深度 ,能够 发 掘 更 多 的 案件 线索 和 规律 ,并 且 由 数据 计算 分 析 所 得 出 的 结 
果 也 更 为 科学 化 。 

(3) 数据 展示 环节 更 加 形象 化 .直观 化 。 在 信息 、 数 据 完成 分 析 之 后 ， 
侦查 人 员 需 要 根据 数据 分 析 结 果 来 部 署 侦查 措施 .还 原 犯 罪 事实 。 传 统 的 
信息 分 析 结 果 一 般 以 文字 形式 或 是 简单 的 统计 图 表 形 式 进 行 展示 。 而 大 
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数据 时 代 , 数 据 分 析 结 果 则 可 以 依托 于 形象 化 的 可 视 化 工具 进行 展示 。 可 
视 化 技术 能 够 将 数据 的 各 个 维度 以 立体 化 的 图 像 .动画 等 形式 展示 出 来 ， 
从 图 像 上 就 能 够 直接 全面、 形象 地 反映 出 数据 分 析 结 果 ,"“22 有 利于 侦查 人 
员 从 不 同 维度 去 观察 分 析 , 从 而 更 深入 .更 直观 地 理解 案情 。 总 而 言 之 , 智 
能 化 .可 视 化 的 大 数据 侦查 有 利于 侦查 人 员 将 有 限 的 侦查 资源 分 配 到 更 重 
要 ,更 紧迫 的 案件 上 ,因地制宜 、 因 时 制 宜 地 分 配 人 力 、 物 力 侦 查 资源 ,提高 
侦查 效率 及 侦查 质量 ,完成 粗放 式 侦 查 到 集约 式 侦查 的 转型 。 


第 四 节 本 章 结 论 


本 章 的 核心 内 容 是 提出 “大 数据 侦查 ”这 一 概念 ,结合 大 数据 本 身 和 传 
统 侦查 的 特征 ,去 构建 大 数据 侦查 体系 。 

在 理解 大 数据 时 ,要 注意 大 数据 不 仅仅 是 海量 静态 数据 的 集合 ,更 强 
调 数据 分 析 技 术 以 及 数据 分 析 结果 ,大 数据 本 身 并 不 代表 大 价值 ,大 数据 
的 核心 在 于 对 数据 背后 规律 的 挖掘 。 在 方法 论 层 面 ,大 数据 具有 全 数据 、 
混杂 性 和 相关 性 的 思维 特征 ,尤其 是 “相关 性 ”的 思维 模式 将 带 来 人 类 认 知 
世界 方式 的 改变 。 

在 理解 大 数据 侦查 时 ,可 以 从 广义 和 狭义 两 个 角度 出 发 。 广 义 的 大 数 
据 侦查 概念 强调 以 大 数据 为 核心 ,构建 起 包括 侦查 思维 、 侦 查 模 式 、 侦 查 方 
法 以 及 相关 制度 的 完整 大 数据 侦查 体系 。 狭 义 的 大 数据 侦查 概念 强调 以 
大 数据 技术 为 核心 的 侦查 行为 的 运用 ,并 且 要 注意 大 数据 侦查 的 时 间 轴 向 
前 延伸 至 立案 之 前 ,强调 对 犯罪 活动 的 预测 。 另 外 ,在 理解 大 数据 侦查 的 
概念 时 ,还 要 注意 其 与 技术 侦查 、 信 息 化 侦查 等 一 些 传统 侦查 概念 之 间 的 
区 别 。 

在 侦查 实务 中 ,目前 大 数据 的 分 析 结 果 主 要 用 作 侦 查 线索 ,但 也 不 
排除 在 将 来 出 现 “ 大 数据 ?这 一 新 的 证 据 形 式 。 之 所 以 强调 要 推广 大 数 


51] 徐 继 华 , 冯 启 娜 , 陈 贞 汝 :《 智 慧 政府 一 一 大 数据 治国 时 代 的 来 临 》,111 页 ,北京 ,中 信 出 
版 社 ,2014。 
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据 侦查 ,是 因为 其 本 身 所 具有 的 功能 和 价值 。 相 比 于 传统 侦查 而 言 ,大 
数据 侦查 有 助 于 推动 侦查 朝 着 更 加 科学 化 智能 化 .集约 化 .协作 化 的 
方向 发 展 。 

在 建立 起 大 数据 侦查 的 基本 概念 后 ,本 书 将 会 在 此 基础 上 进一步 探讨 
大 数据 侦查 的 思维 ,大 数据 侦查 的 模式 ,大 数据 侦查 的 方法 以 及 大 数据 侦 
查 的 相关 制度 构建 这 几 部 分 内 容 。 
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本 章 主要 从 思维 层面 出 发 ,探讨 大 数据 侦查 的 思维 特征 ,包括 相关 性 
思维 ,整体 性 思维 ,预测 性 思维 。 与 此 同时 ,也 对 当下 大 数据 过 热浪 潮 中 一 
些 思维 误区 进行 了 澄清 ,强调 大 数据 不 是 万 能 的 ,大 数据 也 有 出 错 的 可 能 。 
与 此 同时 ,大 数据 侦查 的 思维 特征 还 会 对 传统 的 诉讼 程序 .司法 原理 等 带 
来 一 定 的 影响 ,如 预测 性 思维 对 无 罪 推 定 原则 的 影响 ,相关 性 思维 对 司法 
证 明 原 理 的 影响 等 。 


第 一 节 大 数据 侦查 思维 的 体现 


一 、 相 关 性 思维 


相关 性 思维 是 大 数据 之 父 舍 恩 伯 格 所 提出 的 大 数据 三 大 思维 特征 之 
一 ,并 且 是 大 数据 最 重要 的 思维 变革 。 长 久 以 来 ,我 们 人 类 的 思维 范式 都 
是 一 种 诞生 于 小 数据 时 代 的 因果 关系 思维 ,强调 原因 在 前 ,结果 在 后 , 先 产 
生 一 个 假设 ,然后 再 去 验证 假设 的 正确 性 。 传 统 的 侦查 思维 乃至 整个 法 律 
领域 的 思维 ,都 是 建立 在 因果 逻辑 的 基础 上 ,对 犯罪 事实 的 认定 ,必须 严格 
地 遵循 因果 关系 逻辑 ,要 求证 据 与 事实 之 间 具 有 引起 与 被 引起 的 因果 关 
系 。 然 而 ,大 数据 却 颠 覆 了 人 类 传统 的 因果 思维 ,强调 事物 之 间 的 相关 关 
系 而 非 因 果 关 系 。 大 数据 的 相关 性 主要 通过 量化 两 个 数值 之 间 的 数理 关 
系 而 得 出 ,这 种 相关 性 只 能 告诉 人 们 是 什么 却 不 能 解释 为 什么 , 即 “ 知 其 然 
而 不 知 其 所 以 然 ”, 凭 借 人 类 的 主观 经 验 有 时 候 也 难以 对 这 种 相关 性 进行 
因果 关系 解释 。 将 大 数据 的 相关 性 思维 运用 至 侦查 中 ,可 以 大 大 拓展 侦查 
的 思维 视野 ,发 掘 更 多 的 线索 情报。 具体 而 言 ,侦查 人 员 可 以 从 以 下 两 个 
方面 运用 大 数据 相关 性 思维 。 
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第 一 ,“ 找 到 一 个 关联 物 并 监测 它 ”, 这 是 大 数据 的 一 个 经 典 理论 ,大 数 
据 可 以 找到 一 个 现象 的 良好 关联 物 ,通过 对 关联 物 的 分 析 来 观测 现象 本 
身 。 大 数据 的 这 一 原理 同样 可 以 运用 于 侦查 领域 ,如 果 甲 和 乙 经 常 一 起 出 
现 , 只 要 甲 现象 发 生 了 ,那么 我 们 就 可 以 推测 乙 现象 也 发 生 了 。 例 如 可 以 
通过 对 证 券 账 户 的 观测 来 监控 证 券 欺 诈 现 象 ,可 以 通过 对 个 人 资产 数据 的 
监控 来 判断 国家 工作 人 员 是 否 有 贪污 受贿 嫌疑 等 ,可 以 通过 对 社交 关系 网 
的 分 析 来 判断 哪些 人 与 念 怖 分 子 有 联系 等 ,这 些 都 是 大 数据 相关 关系 在 侦 
查 中 的 具体 运用 。 并 且 , 随 着 大 数据 技术 的 发 展 ,未 来 我 们 不 再 需要 人 工 
选择 关联 物 ,大 数据 通过 计算 能 够 告诉 我 们 谁 是 最 好 的 代理 人 .5 

第 二 ,挖掘 数据 背后 的 相关 性 。 在 传统 的 侦查 中 , 侦查 人 员 和 凭借 主观 
能 力 、 主 观 经 验 ,往往 只 能 收集 看 起 来 与 案件 有 明显 因果 关系 的 线索 、 证 
据 , 但 是 大 数据 方法 则 能 够 从 海量 看 似 与 案件 无 关 的 数据 中 挖掘 出 相关 信 
息 , 并 用 作案 件 侦 查 的 线索 。 例 如 现在 侦查 实务 中 所 流行 的 手机 数据 控 
掘 、 话 单数 据 挖掘 方法 ,海量 的 手机 数据 .通讯 数据 看 似 与 案件 并 无 关系 ， 
但 是 对 其 进行 数据 挖掘 后 , 则 能 够 发 现 当事人 的 行踪 轨迹 、 人 际 交往 关系 、 
通话 规律 ,购物 规律 等 大 量 有 价值 的 信息 。 这 些 信 息 看 似 与 案件 事实 没有 
因果 关系 ,但 经 进一步 分 析 后 能 够 为 案件 侦查 提供 线索 情报。 例如 在 丁 省 
W 市 检察 院 查 办 的 一 起 贪污 贿赂 案件 中 ,举报 人 称 嫌疑 人 受贿 贪污 资产 达 
上 千 万 元 ,但 侦查 人 员 并 没有 发 现 嫌疑 人 本 人 、 家 庭 成 员 房产 .银行 存款 、 
证 券 资产 等 明显 异常 情况 。 后 侦查 人 员 对 嫌疑 人 的 手机 数据 进行 收集 并 
分 析 , 发现 以 下 几 条 敏感 信息 : 通讯 录 中 多 位 密切 联系 人 为 该 区 著名 公司 
企业 老板 ,深圳 某 区 供电 局 告知 本 月 用 电 度数 和 电费 金额 ,嫌疑 人 咨询 如 
何 办 理 移民 香港 手续 。 侦 查 人 员 事 先 已 知 其 女儿 在 香港 定居 ,结合 手机 中 
的 敏感 信息 ,推测 嫌疑 人 在 深圳 有 房产 ,资产 大 部 分 已 经 转移 香港 ,并 有 移 
民 香 港 的 倾向 ,并 据 此 为 突破 口 对 嫌疑 人 展开 讯问 ;同时 ,分 析 有 关公 司 经 
营 活动 与 嫌疑 人 职责 职权 的 关联 关系 ,对 与 嫌疑 人 密切 联系 的 企业 老板 进 


51] [ 英 ] 维 克 托 。 迈 尔 - 舍 轧 伯 格 , 肯 尼 斯 。 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ,75 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 
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行 深度 话 单 分 析 ; 侦查 人 员 还 根据 手机 数据 对 嫌疑 人 的 兴趣 爱好 、 行 为 特 
征 以 及 交往 群体 进行 了 分 析 并 以 此 来 制定 审讯 策略 。 最 终 案 件 成 功 侦破 ， 
查获 嫌疑 人 受贿 556 万 余 元 ,贪污 20 余万元 的 犯罪 事实 。 在 本 案 中 ,手机 
“大 数据 ?大 大 拓展 了 侦查 范围 ,很 多 隐藏 的 线索 在 “大 数据 ?技术 下 纷纷 浮 
出 水 面 。 

由 此 可 见 ,大 数据 相关 性 思维 能 够 大 大 拓展 侦查 线索 .情报 的 来 源 。 
引导 侦查 人 员 多 角度 、 全 方位 地 寻找 案件 破案 口 。 这 也 提醒 了 侦查 人 员 ， 
在 直接 对 案件 嫌疑 人 展开 侦查 有 障碍 时 ,可 以 从 与 人 或 事 相关 的 现象 着 手 
展开 分 析 ; 当 物理 空间 的 线索 .证据 不 足 时 ,侦查 人 员 可 以 寻找 虚拟 空间 的 
相关 数据 ,通过 对 数据 的 二 次 分 析 来 发 掘 更 深层 次 的 信息 。 


二 、 整 体 性 思维 


在 小 数据 时 代 , 由 于 人 类 获取 信息 的 能 力 有 限 ,在 面 对 大 量 数据 集 时 ， 
只 能 采用 抽样 调查 的 方法 ,希望 通过 科学 的 抽样 方法 来 获取 尽 可 能 准确 的 
统计 结果 。 但 即使 选取 样本 的 方法 再 科学 ,也 无 法 获取 全 部 的 数据 ,而 一 
些 重要 的 信息 很 可 能 就 在 这 些 “ 非 样本 ”数据 中 。 构 建 于 “小 数据 ”时代 的 
传统 侦查 思维 ,同样 不 可 避免 地 带 上 “抽样 "的 印记 ,主要 体现 在 以 下 两 个 
方面 。 

第 一 ,取证 思维 的 有 限 性 。 在 犯罪 发 生 过 程 中 ,会 在 物理 空间 留 下 各 
种 痕迹 ,然而 由 于 时 空 条 件 的 限制 和 人 类 认 知 能 力 的 有 限 性 ,侦查 人 员 只 
能 获取 一 部 分 的 线索 .证据 。 这 部 分 线索 .证 据 充其量 只 是 一 小 部 分 ,侦查 
人 员 不 会 知道 在 这 之 外 还 有 多 少 未 知 的 证 据 。 

第 二 ,事实 还 原 思维 的 片面 性 。 在 传统 的 侦查 中 ,司法 人 员 根 据 已 经 
收集 的 证 据 , 通 过 每 个 证 据 去 还 原 一 个 个 零散 事实 ,再 通过 这 些 零散 的 事 
实 去 拼凑 出 “整体 ”事实 ,这 是 一 种 “小 事实 到 大 事实 "的 逻辑 过 程 。 然 而 由 
于 获取 证 据 的 有 限 性 ,所 还 原 出 的 事实 往往 是 不 全 面 的 ,并 且 往 往 带 有 司 
法 人 员 主 观 推断 的 成 分 ,甚至 会 由 于 证 据 的 不 足 而 不 得 不 放弃 对 真相 的 追 
求 。 通 过 对 单个 证 据 的 收集 和 审查 去 认定 案件 事实 ,充其量 是 一 种 小 数据 
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时 代 的 抽样 调查 方法 ,这 种 样本 分 析 法 往往 不 可 避免 地 带 有 偏见 和 
漏洞 515 

然而 ,大 数据 思维 的 首要 转变 就 是 摆脱 抽样 数据 的 束缚 ,运用 整体 的 、 
所 有 的 数据 ."? 在 大 数据 时 代 ,我 们 完全 有 条 件 去 获得 某 个 研究 对 象 的 所 
有 数据 ,达到 “样本 三 总 体 ”的 规模 ,不 必 再 拘泥 于 技术 限制 进行 数据 抽样 
分 析 , 大 数据 时 代 再 局 限于 抽样 的 分 析 方 法 就 像 汽车 时 代 骑 马 一 样 奇 
怪 .3 这 种 “全 数据 ”的 思维 模式 ,有 利于 人 们 对 事件 进行 全 景 式 的 观察 ， 
不 放 过 任何 一 个 细节 ,弥补 了 传统 抽样 调查 片面 性 的 缺陷 。 大 数据 侦查 思 
维 同样 带 有 “全 数据 "色彩 ,呈现 出 与 以 往 不 同 的 “整体 性 思维 ”的 特征 ,这 
在 取证 和 事实 还 原 两 个 阶段 都 有 所 体现 。 

第 一 ,取证 思维 的 整体 性 。 大 数据 时 代 建 立 起 一 个 与 物理 世界 相对 应 
的 平行 数据 空间 ,大 数据 侦查 便 在 这 样 的 数据 空间 中 展开 ,不 再 拘泥 于 现 
实 世 界 的 书证 、 物 证 .人 证 等 载体 ,而 是 关注 虚拟 世界 的 相关 数据 。 数 据 空 
间 的 技术 特征 赋予 了 侦查 人 员 获 取 全 数据 的 可 能 性 ,对 数据 进行 整体 性 、 
全 面 性 获取 。 因 而 ,大 数据 侦查 的 取证 思维 也 具有 整体 性 特征 ,或 许 与 案 
件 有 关 的 数据 仅仅 是 一 小 部 分 ,但 是 大 数据 侦查 需要 先 获 取 一 定 范围 内 的 
所 有 数据 ,再 通过 挖掘 、 磁 撞 等 大 数据 方法 得 出 与 案件 相关 的 信息 。 例 如 ， 
若是 想 找 出 嫌疑 人 通话 记录 中 的 可 疑 通话 ,侦查 人 员 必 然 需 要 先 获取 其 一 
段 时 间 内 所 有 的 通话 记录 ,再 通过 数据 之 间 的 搜索 、 碰 撞 等 方法 才能 找 出 
可 疑 通话 。 因 此 ,大 数据 侦查 应 当 抛 弃 传统 的 片面 性 取证 思维 ,取而代之 
以 整体 性 思维 一 一 在 获取 全 体 数据 的 基础 之 上 ,通过 数据 分 析 方 法 来 进 一 
步 寻找 与 案件 相关 的 数据 。 大 数据 侦查 遵循 着 从 大 数据 到 小 数据 ?的 取 
证 模式 , 相 比 于 传统 取证 范围 .数量 的 有 限 性 ,大 数据 的 整体 性 取证 模式 获 


C51) 封 利 强 :《 事 实 认定 的 原子 模式 与 整体 模式 之 比较 考察 )》, 载 李 学 军 主编 :《 证 据 学 论坛 》 
(第 十 七 卷 ) ,115 页 ,北京 ,法 律 出 版 社 ,2012。 

52] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 。 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ,29 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 

53] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼斯 - 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 ,周涛 译 ,43 页 , 杭 
州 , 浙 江 人 民 出 版 社 ,2013 。 


。57 。 


大 数据 侦查 


取 的 信息 无 疑 更 加 全 面 。 

第 二 ,事实 还 原 思维 的 整体 性 。 取 证 思维 的 整体 性 同样 也 带 来 事实 还 
原 思维 的 整体 性 。 在 传统 侦查 思维 中 ,司法 人 员 通 过 一 个 个 线索 、 证 据 去 
还 原 事实 零散 片段 ,再 将 这 些 零 散 的 片段 拼凑 出 整体 事实 。 而 大 数据 侦查 
则 运用 一 种 整体 性 的 事实 还 原 思维 ,首先 还 原 出 更 广泛 意义 上 的 "大事 
实 ” 一 一 例如 想 获 取 嫌 疑 人 贪污 贿赂 的 事实 ,侦查 人 员 可 以 通过 手机 数据 、 
电脑 数据 、 网 络 数 据 、 视 频数 据 等 各 个 维度 的 数据 去 还 原 嫌疑 人 在 一 段 时 
间 内 的 完整 生活 、 工 作 事实 ,而 与 案件 相关 的 事实 必然 也 置 于 这 个 “大 事 
实 " 之 中 ;在 此 基础 上 ,侦查 人 员 再 借助 一 定 的 技术 手段 去 判断 .甄别 其 中 
与 案件 有 关 的 事实 。 这 是 一 种 从 * 大 事实 到 小 事实 ”的 逻辑 过 程 。 相 比 于 
传统 片面 化 .零散 化 的 事实 认定 方式 ,大 数据 侦查 基于 整体 性 思维 ,所 还 原 
出 的 事实 更 具有 全 面 性 和 完整 性 。" 1 











图 3-1 传统 侦查 中 的 事实 认定 思维 


[1] 需要 注意 的 是 ,本 文 此 处 所 谓 的 “事实 认定 的 整体 性 ”, 并 不 一 定 就 是 所 有 的 案件 事实 ， 
有 可 能 只 是 整个 案件 事实 的 某 个 组 成 部 分 ,但 即便 是 这 种 部 分 事实 ,大 数据 思维 下 对 其 认定 也 是 采 
用 的 整体 性 思维 逻辑 。 
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大 (整体 ) 数据 


小 事实 /案件 
事实 





图 3-2 大 数据 侦查 中 的 事实 认定 思维 


三 、 预测 性 思维 


大 数据 之 父 (维克托 。 迈 尔 - 伟 恩 伯 格 ) 认 为 大 数据 最 重要 的 价值 在 于 
其 预测 功能 ,预测 是 大 数据 的 核心 价值 。 对 未 来 世界 进行 预测 一 直 是 人 类 
长 期 以 来 可 望 而 不 可 即 的 能 力 ,试想 一 下 ,如 果 我 们 能 事先 知道 未 来 事情 
的 发 展 走向 ,就 能 够 扬长 避 短 ,未 雨 绸 缪 ,提前 做 好 预防 措施 ,合理 规避 风 
险 ,这 对 于 人 类 的 进步 发 展 将 具有 划时代 意义 。 而 大 数据 技术 使 得 人 类 的 
预测 能 力 成 为 现实 ,至 少 以 目前 的 技术 来 看 ,能 够 在 一 定 范围 内 预测 事情 
的 发 展 走向 。 例 如 ,百度 开发 的 旅游 景点 预测 应 用 能 够 达到 90% 的 准确 
率 , 其 原理 就 在 于 我 们 很 多 人 习惯 于 事前 在 网 络 上 搜索 旅游 地 的 信息 , 因 
而 搜索 行为 数据 与 实际 旅游 数据 之 间 有 着 某 种 相关 性 ,大 数据 系统 根据 这 
种 相关 性 就 能 够 预测 出 旅游 人 数 ,并 与 旅游 局 公布 的 数据 达到 惊人 的 一 
致 。 此 外 ,社交 网 站 推送 我 们 感 兴趣 的 话题 ,购物 网 站 推送 我 们 心仪 的 商 
品 , 搜 索引 擎 网 站 能 够 预测 流行 病 趋势 ,经济 发 展 趋势 等 ,都 是 大 数据 预测 
功能 的 体现 。( 如 图 3-3 所 示 )"1) 

大 数据 预测 的 原理 就 在 于 相关 关系 的 分 析 , 通 过 对 关联 物 的 观察 来 预 
测 未 来 。 我 们 同样 可 以 将 大 数据 预测 原理 应 用 于 犯罪 侦查 中 。 按 常理 来 
说 ,犯罪 活动 一 般 不 会 是 瞬间 的 ,而 是 一 个 循序 渐进 的 发 展 过 程 , 包 括 犯 罪 


[C1] 例如 百度 网 站 根据 其 海量 的 搜索 数据 ,开发 出 “百度 预测 功能, 能够 对 流行 病 . 景 区 每 
适度 ,经 济 发 展 ,电影 票房 .体育 赛事 等 进行 准确 的 预测 。 
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一 一 北京 市 旅游 委 一 一 百度 预测 
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3-3 百度 对 故宫 游客 预测 值 与 实际 人 数 对 比 图 


准备 活动 .犯罪 预备 ,犯罪 实施 及 犯罪 结束 等 一 系列 环节 。 侦 查 人 员 可 以 
通过 大 数据 的 预测 功能 ,在 犯罪 活动 实施 前 去 捕捉 犯罪 信号 。 例 如 愁 怖 犯 
罪 活 动 中 ,犯罪 分 子 一 般 会 有 购买 枪支 .炸药 、 刀 具 等 准备 行为 ,如 果 能 够 
事先 对 这 些 购买 数据 实现 监控 , 则 能 够 及 时 发 现 异常 ,预测 犯罪 活动 的 发 
生 ; 慌 怖 犯罪 分 子 的 行为 轨迹 也 具有 一 定 特征 ,我 国 的 暴 恺 分 子 往往 从 新 
疆 . 广 西 ` 云 南 等 边境 地 区 向 内 地 迁移 ,侦查 人 员 同 样 可 以 通过 和 恐 怖 组 织 成 
员 的 行为 轨迹 数据 去 捕 提 异常 信号 。 大 数据 预测 思维 在 犯罪 侦查 领域 的 
运用 ,往往 比 在 其 他 领域 的 运用 发 挥 更 大 的 价值 。 不 仅 有 助 于 侦查 机 关 合 
理 分 配 侦查 资源 ,提高 打击 犯罪 的 精准 性 ,更 重要 的 是 能 够 在 一 些 犯 罪 活 
动 尚未 发 生 或 者 是 在 其 发 生 过 程 中 ,就 及 时 将 其 识别 ,从 源头 上 保护 公民 
的 生命 ,财产 等 利益 免 遭 侵犯 。 具 体 而 言 ,侦查 人 员 则 可 以 从 以 下 几 个 角 
度 去 预测 犯罪 的 发 生 。 

(1) 着 眼 于 对 案件 的 预测 。 每 种 犯罪 都 有 一 种 或 几 种 特定 的 行为 模 
式 , 根 据 每 种 犯罪 行为 模式 来 建立 特定 预测 模型 ,并 将 预测 模型 运用 于 对 
关联 数据 的 监控 ,就 能 够 达到 预测 犯罪 的 效果 。 例 如 内 幕 交易 行为 往往 体 
现 为 股票 交易 数据 的 异常 ,证 监 会 根据 历史 内 幕 交易 犯罪 数据 计算 出 其 犯 
罪 模型 ,并 将 特定 的 算法 模型 投放 至 海量 的 股票 交易 数据 中 ,就 能 够 迅速 
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识别 出 异常 交易 账户 ,它们 很 可 能 就 是 内 幕 交 易 案件 的 线索 ;再 如 腾讯 公 
司 与 公安 机 关 合 作成 立 的 反 诈 骗 联 盟 中 心 ,他们 的 * 反 欺诈 识别 数据 模型 ” 
能 够 对 一 些 涉 嫌 诈 骗 的 账号 、 网 址 进行 自动 识别 和 拦截 ,从 而 将 网 络 欺诈 
活动 扼杀 在 萌芽 中 ,其 运用 的 也 是 这 一 原理 。 

(2) 着 眼 于 对 犯罪 分 子 的 预测 。 犯 罪 活动 还 会 在 人 群 上 呈现 一 定 的 特 
征 模式 。 就 犯罪 分 子 与 普通 人 而 言 ,他 们 会 有 一 些 异 常 特征 ,这 些 特征 会 
通过 行为 轨迹 数据 ,旅店 住宿 等 数据 体现 出 来 ;就 不 同 案件 的 犯罪 分 子 而 
言 , 他 们 在 地 域 .身份 等 方面 都 有 着 不 同 的 特征 。 侦 查 人 员 可 以 利用 犯罪 
分 子 的 数据 特征 模式 ,对 其 犯罪 的 可 能 性 及 犯罪 概率 进行 预测 。 例 如 江苏 
省 某 市 检察 院 正 在 探索 建立 的 “大 数据 风险 立案 制度 ”, 其 原理 就 在 于 对 嫌 
疑 人 的 特征 进行 数据 挖掘 ,进而 进行 犯罪 风险 的 预测 。 具 体 运作 过 程 如 
下 : 在 职务 犯罪 案件 的 初 查 阶 段 , 侦 查 人 员 根 据 对 既 有 的 数据 库 的 查询 及 
分 析 , 全 面 ` 具 体 地 了 解 被 查 对 象 和 有 关 涉案 人 员 的 基本 情况 及 其 相互 关 
系 ,对 其 家 庭 资产 情况 、 社 会 交往 群体 、 经 济 社会 活动 形成 总 体 性 的 认识 。 
在 此 基础 上 对 被 查 对 象 是 否 涉嫌 职务 犯罪 以 及 犯罪 领域 .范围 .严重 程度 
形成 初步 的 判断 ,并 以 之 作为 是 否 立 案 的 依据 。 

(3) 着 眼 于 对 整体 犯罪 趋势 的 预测 。 这 种 预测 方式 不 针对 具体 个 案 或 
具体 犯罪 分 子 ,而 是 针对 某 一 地 区 的 整体 犯罪 情况 。 通 过 对 某 一 地 区 历史 


未 来 一 段 时 期 的 高 危 地 区 、 犯 罪 类 型 等 犯罪 走势 进行 预测 。 犯 罪 热 点 预测 
并 不 是 幻想 ,实践 中 我 国 已 经 有 不 少 侦查 机 关 开始 推行 这 一 技术 。 例 如 北 
京 市 怀柔 区 公安 局 2013 年 建立 了 “犯罪 数据 分 析 和 趋势 预测 系统 ”, 以 该 
地 区 近 十 年 的 犯罪 数据 为 基础 ,依托 于 大 数据 犯罪 热点 分 析 系 统 ,对 未 来 
的 犯罪 活动 实现 了 较为 精准 的 预测 。 在 该 系统 运用 后 ,怀柔 区 的 发 案 率 、 
报案 率 、 接 警 率 都 大 幅度 下 降 , 尤 其 是 为 该 地 区 2014 年 APEC 会 议 期 间 的 
社会 治安 提供 了 有 效 的 安全 保障 .5 


51] 《大 数据 能 预测 哪里 易 发 犯罪 ), 载 新 浪 网 http://news. sina. com. cn/o/2014-06-23/ 
141930407753. shtml, 最 后 访问 时 间 : 2016 年 9 月 23 日 。 
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我 国 在 2015 年 进入 大 数据 元 年 ,大 数据 正式 上 升 为 国家 战略 ,各 行 各 
业 都 在 如 火 如 茶 地 发 展 大 数据 计划 。 在 这 样 的 趋势 下 ,人 们 容易 产生 激进 
主义 思潮 ,过 度 依赖 、 迷 信 大 数据 ,甚至 有 学 者 认为 大 数据 意味 着 人 类 理论 
时 代 的 终结 (the end of theory) , 仅 赁 数据 的 相关 关系 ,就 可 以 解决 一 切 问 
题 。 实 际 上 ,大 数据 不 一 定 就 是 客观 中 立 的 ,大 数据 也 会 出 错 、 会 产生 偏见 
性 判断 ,大 数据 的 相关 关系 能 否 蔡 代 人 类 长 久 以 来 的 因果 关系 目前 也 还 广 
遭 质疑 。 在 侦查 领域 ,我 们 同样 需要 谨防 在 大 数据 热潮 下 所 产生 的 一 些 思 
维 误区 ,如 “数据 越 多 越 好 ”数据 可 以 不 精确 “大 数据 一 定 是 客观 准确 的 ” 
“相关 性 可 以 蔡 代 因果 性 ?等 都 是 常见 的 思维 误区 。 


一 、 数 据 越 多 越 好 


大 数据 最 显著 的 特点 就 在 于 数据 之 “大 ”, 强 调 通过 对 海量 数据 进行 
分 析 。 因 而 ,人 们 很 容易 产生 一 种 思维 误区 ,认为 数据 量 越 多 越 好 。 实 际 
上 ,这 里 的 数据 之 大 主要 是 为 了 区 分 小 数据 时 代 人 类 统计 所 采用 的 “ 抽 
样 ” 法 。 在 过 去 由 于 数据 集成 技术 的 有 限 性 ,人 们 无 法 记录 、 获 取 关 于 某 
个 对 象 的 全 部 数据 ,因而 只 能 退 而 求 其 次 采用 具有 代表 性 的 抽样 数据 ;而 
在 大 数据 时 代 人 类 则 完全 有 能 力 获 取 所 有 数据 ,达到 “样本 三 全 体 ” 的 数 
量 级 ,这 便 是 大 数据 “大 ”的 实质 意义 所 在 。 这 里 的 数据 之 “大 ”具有 一 定 
的 相对 性 ,即便 人 类 的 数据 收集 技术 再 先进 ,也 不 可 能 穷 极 所 有 的 数据 。 
因而 ,对 于 某 一 分 析 对 象 而 言 , 只 要 收集 了 一 定 范围 内 与 之 相关 的 全 体 数 
据 , 大 致 达到 “样本 三 全 体 ” 的 程度 即 可 。 例 如 要 对 嫌疑 人 的 通话 数据 进 
行 分 析 , 我 们 不 可 能 调 取 其 几 十 年 来 所 有 的 通话 数据 ,一 般 只 需 调 取 其 在 
案 发 前 后 一 段 时 间 内 的 通话 数据 ,这 样 的 数据 量 就 已 经 达到 “大 数据 ”的 
量 级 了 。 

在 大 数据 侦查 中 ,要 把 握 好 数据 收集 的 “量度 ”。 犯 罪行 为 毕竟 是 在 特 
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定时 空 由 特定 犯罪 人 所 实施 的 行为 ,犯罪 情报 、 线 索 及 证 据 的 收集 需要 与 
案件 具有 一 定 的 相关 性 ,侦查 中 如 果 盲 目地 搜集 过 多 的 数据 ,无 疑 会 带 来 
诸多 无 用 数据 废弃 和 数据 噪声 ,增加 从 海量 数据 中 析 取 有 用 数据 的 难度 。 
此 外 ,侦查 具有 资源 有 限 性 和 时 效 性 的 特征 ,收集 过 多 的 数据 必然 需要 投 
入 更 多 的 时 间 和 精力 去 分 析 、 提 取 数 据 , 增 加 侦查 人 员工 作 的 负担 。 侦 查 
人 员 应 该 将 更 多 的 精力 放 在 对 数据 的 分 析 、 挖 气 上 ,而 不 是 盲目 消耗 在 数 
据 收 集 环 节 。 因 此 ,在 大 数据 侦查 过 程 中 要 避免 过 度 陷 人 ”数据 越 多 越 好 ” 
的 思维 误区 ,应 当 以 具体 案件 .犯罪 嫌疑 人 等 要 素 为 坐标 ,选取 一 定时 空 范 
围 内 的 相应 数据 ,达到 一 定 范围 内 的 “样本 三 总 体 ” 即 可 。 


二 、 数据 源 可 以 不 精确 


在 大 数据 时 代 , 要 求 每 一 数据 都 精确 无 误 是 不 可 能 的 。 随 着 数据 量 的 
增 大 ,大 数据 的 算法 允许 不 精确 的 数据 、 混 杂 的 数据 。 容 许 数据 的 混杂 性 
有 利于 减少 数据 处 理 的 时 间 和 成 本 ,反倒 能 够 更 快 地 获悉 事实 真相 ,1 况 
且 数 据 量 的 巨大 往往 可 以 忽略 .抵消 这 些 不 精确 的 数据 ,正如 经 济 学 中 的 
“边际 递减 效应 ”原理 , 当 总 数 越 来 越 大 时 , 增 量 的 效应 反而 会 递减 。 然 而 ， 
这 并 不 意味 着 我 们 可 以 完全 忽视 数据 中 的 错误 , 走 和 人 另 一 个 极端 。 当 错误 
的 数据 达到 一 定 程 度 时 ,即便 是 数据 的 量 再 大 也 无 法 弥补 错误 ,这 些 劣质 
的 、 错 误 的 大 数据 会 降低 数据 分 析 结果 的 有 效 性 ,直接 影响 到 数据 分 析 结 
果 的 准确 性 。 实 务 中 不 乏 数 据 错 误 酿 成 大 祸 的 案例 : 例如 ,在 美国 有 
40 000 000 人 的 信用 报告 中 ,其 中 20 000 000 人 的 信用 报告 存在 严重 的 数 
据 错 误 ;22 在 美国 ,由 于 数据 源 及 数据 计算 错误 ,每 年 都 会 造成 大 量 的 医疗 


51] [ 英 ] 维 克 托 。 迈 尔 - 舍 思 伯 格 , 肯 尼斯 " 库 克 耶 :《 大 数据 时 代 》, 盛 杨 燕 , 周 涛 译 ,65 页 ， 
杭州 ,浙江 人 民 出 版 社 ,2013。 

[2] 60 Minutes: 40 Million Mistakes: Is Your Credit Report Accurate? (CBS television 
broadcastFeb. 10 ,2013) ,http://www. cbsnews. com/8301-18560_162-57567957/credit/,2016 年 9 
月 25 日 访问 。 
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事故 和 生产 事故 ,导致 近 十 万 名 患者 死亡 以 及 上 亿美 元 的 经 济 损失 .5 

数据 错误 主要 涉及 大 数据 运用 中 的 “数据 质量 问题。 数据 质量 意 指 
数据 的 一 致 性 (consistency) 正确 性 (correctness)、 完 整 性 (completeness) 
和 最 小 性 Cminimality) 523 满足 了 这 几 个 性 质 的 数据 便 符 合 了 数据 质量 要 
求 ,具有 可 用 性 。 但 实际 上 ,在 数据 产生 过 程 中 由 于 系统 环境 的 复杂 性 、 数 
据 标准 不 一 致 以 及 数据 结构 的 差异 性 ,数据 源 天 生 就 会 带 有 质量 上 的 问 
题 。 常 见 的 数据 质量 问题 有 以 下 几 类 : 数据 的 错误 ,例如 数据 字段 本 身 的 
错误 或 拼写 的 错误 ,如 将 一 个 人 的 年 龄 写成 485; 数 据 的 重复 ,同一 事物 往 
往 有 着 不 同 的 数据 表达 形式 ,这 些 表达 往往 是 重复 的 ,需要 对 之 进行 识别 、 
简化 ;数据 的 缺失 , 某 一 数据 体系 中 丢失 个 别 重 要 数据 ,而 这 些 数据 对 结果 
的 分 析 又 具有 至 关 重 要 作用 ,因而 需要 通过 一 定 方法 对 丢失 的 数据 进行 填 
充 ; 数 据 的 不 一 致 ,对 于 同一 事物 会 有 相 异 的 不 同 数据 表达 形式 , 需要 从 中 
选 出 正确 的 数值 ;数据 的 过 时 ;一 些 人 为 的 主观 错误 也 可 能 造成 数据 的 质 
量 问 题 , 如 数据 造假 行为 。 另 外 , 随 着 事物 的 变化 发 展 ,数据 的 质量 问题 会 
不 断 地 产生 , 既 有 的 质量 问题 解决 后 , 随 着 数据 生命 的 发 展 ,还 会 产生 新 的 
数据 质量 问题 ,因而 需要 将 数据 清洗 工作 作为 一 个 循环 往复 的 过 程 ,不 断 
地 提高 数据 质量 。537 

在 大 数据 侦查 实务 中 ,同样 存在 上 述 数据 质量 问题 。 侦 查 中 所 采集 的 
初始 数据 源 都 会 存在 或 多 或 少 的 错误 ,如 格式 不 一 、 数 据 缺 失 、 数 据 重复 、 
数据 过 时 等 。 以 侦查 中 常见 的 地 址 数据 为 例 , 录 入 的 地 址 编码 经 常 出 现 一 
址 多 名 问题 (一 些 地 址 往往 有 多 个 名 称 ) 、 地 址 重 名 的 问题 ( 即 多 个 地 点 通 


[1] Shilakes C,Tylman J. Enterprise information portals[ R]. New York: Merrill Lynch, 
1998; Rahm E, Dohh. Data cleaning: Problems and current approaches [J]. IEEE Data 
Engineering Bulletin,2000,23(4): 3-13. 转 引 自 李 建 中 , 刘 显 敏 :《 大 数据 的 一 个 重要 方面 : 数据 可 
用 性 》, 载 (计算 机 研究 与 发 展 ),2013(6)。 

C52] 郭志 懋 , 周 傲 英 :《 数 据 质量 和 数据 清洗 研究 综述 )》, 载 (软件 学 报 》,2002(11) 。 

53] 韩 京 宇 , 徐 立 至 , 董 逸 生 :《 数 据 质量 研究 综述 》, 载 (计算 机 科学 》,2008(2) 。 
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用 一 个 名 称 ) 、 地 址 拼写 错误 、 地 址 不 完整 等 问题 ;5! 以 人 名 数据 为 例 , 有 些 
人 名 错误 可 能 来 源 于 犯罪 分 子 的 故意 谎报 ,掩盖 身份 行为 ,也 有 可 能 是 操 
作 人 员 录 入 时 的 错误 ,还 有 些 则 是 格式 上 的 差异 ,例如 同样 的 姓名 可 能 会 
有 “Johnny D. Smith”“John Daniel Smith” 等 不 同 的 表述 。 此 外 ,有 些 犯 罪 
分 子 具 有 反 侦 查 意识 ,其 实施 的 反 侦 查 行为 会 产生 误导 性 数据 ,但 大 数据 
系统 却 无 法 识别 这 些 虚 假 数据 .5 22 


三 、 大 数据 一 定 是 客观 准确 的 


很 多 人 认为 大 数据 的 分 析 结 果 就 一 定 是 客观 中 立 的 、 准 确 无 误 的 ,但 
实际 上 并 非 如 此 。 从 数据 采集 、 数 据 清 洗 到 数据 分 析 的 每 一 环节 都 涉及 人 
为 主观 影响 ,都 有 可 能 产生 错误 ,如 数据 采集 偏差 .数据 分 析 错 误 、 大 数据 
歧视 等 。 归 根 结 底 , 数 据 本 身 还 是 由 人 为 去 操控 的 ,从 而 也 不 可 避免 地 带 
有 来 自 人 类 主观 经 验 的 错误 、 偏 见 等 。"5 

(一 ) 数据 采集 的 偏差 

大 数据 的 “全 数据 ?特征 能 够 克服 小 数据 时 代 抽 样 调查 多 造成 的 数据 
不 全 面 缺陷 。 但 是 由 于 地 区 .人 群 信息 发 展 水 平 不 平衡 以 及 人 们 对 于 不 同 
信息 工具 的 偏好 ,在 大 数据 采集 过 程 中 有 可 能 造成 数据 偏差 ,为 后 面 的 数 
据 分 析 埋 下 隐患 。 即 数据 源 在 采集 的 过 程 中 本 就 是 不 平等 的 ,相当 一 部 分 


群众 .地 区 的 意见 并 没有 得 到 数据 的 表达 ,有 学 者 称 之 为 数据 盲点 “数据 
阴影 .数据 黑暗 地 带 等 。 


51] [ 英 ]Spencer Chainey、[ 美 JJerry Ratcliffe:《 地 理 信息 系统 与 犯罪 制图 》, 陈 鹏 , 洪 卫 军 ， 
晋 光 等 译 ,38 一 40 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2014。 

[2] See Seidler, Patrick; Adderley, Rick, “Criminal Network Analysis inside Law 
Enforcement Agencies : A Data-Mining System Approach under the National Intelligence Model”, 
Tnternational Journal of Police Science & Management ,4(2013) ,pp. 323-337. 

53] 凯特 . 克 劳 福 德 :《 对 大 数据 的 再 思考 》, 载 美国 (外 交 政 策 ) 杂 志 网 站 5 月 9 日 。 转 引 自 
360 网 http://www. 360doc. com/content/14/0815/10/19446 _402076305. shtml, 最 后 访问 时 间 : 
2016 年 9 月 27 日 。 

C4] 徐 继 华 , 冯 启 娜 , 陈 贞 汝 :《 智 慧 政府 : 大 数据 治国 时 代 的 来 临 》,223 页 ,北京 ,中 信 出 版 
社 ,2014。 
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以 我 国 的 网 络 数据 为 例 , 其 在 数据 采集 过 程 中 有 可 能 存在 的 偏差 。 
@ 地 域 信 息 发 展 水 平 不 均衡 会 产生 的 偏差 。 我 国 的 网 络 信息 化 发 展 水 平 
旦 发 展 不 均 态势 ,东部 沿海 地 区 高 于 中 西部 地 区 ,城市 水 平 高 于 农村 ,这 就 
有 可 能 造成 农村 地 区 、 西 部 地 区 一 些 现 象 、 观 点 不 会 在 网 络 上 呈现 出 来 。 
人 群 信息 发 展 水 平 不 均衡 会 产生 偏差 。 我国 上 网 的 主要 群体 是 中 青年 ， 
20 一 40 岁 的 人 群 网 络 活跃 度 较 高 ,儿童 .青少年 及 老年 群体 上 网 较 少 ,他 们 
的 行为 、 观 点 也 难以 在 网 络 上 全 面体 现 。@@ 不 同人 群 对 信息 工具 的 不 同 偏 
好 也 会 产生 偏差 。 例 如 百度 是 我 国 最 大 的 搜索 引擎 网 站 ,其 用 户 数据 基本 
能 够 代表 我 国 网 民 的 搜索 情况 ,但 即便 如 此 ,也 有 部 分 用 户 习 惯 于 使 用 其 
他 搜索 平台 ,这 就 会 导致 数据 采集 的 不 全 面 。 由 此 可 见 ,经 济 、 地 域 . 收 
入 ,年 龄 等 差异 很 可 能 造成 巨大 的 “数据 鸿沟 ”, 如 何 保证 现实 世界 中 的 观 
点 .声音 被 数据 全 面 反映 ,已 成 为 大 数据 发 展 过 程 中 不 得 不 面 对 的 基础 
问题 。 

除了 一 般 的 数据 偏差 外 ,在 大 数据 侦查 的 数据 采集 过 程 中 ,还 存在 * 犯 
罪 黑 数 ” 的 问题 。 据 我 国 侦查 实务 人 员 反 映 , 有 案 不 报 、 报 案 不 立 等 现象 使 
得 基层 的 很 多 案件 数据 根本 无 法 采集 。 这 就 导致 用 于 分 析 研 判 的 侦查 大 
数据 本 身 就 不 全 面 ,间接 影响 了 分 析 结 果 的 准确 性 。 实 际 上 ,“ 犯 罪 黑 数 ” 
也 是 各 国家 在 大 数据 侦查 中 所 普遍 面临 的 难题 。 例 如 美国 孟菲斯 警察 局 
的 BLUE CRUSH 大 数据 系统 (Crime Reduction Using Statistical 
History) ,在 2011 年 的 审计 中 发 现 竟然 有 79 000 条 犯罪 数据 没有 录入 ;2 
澳大利亚 犯罪 研究 所 分 析 得 出 ,一般 100 个 报警 信息 中 只 有 40 个 报警 信息 
能 被 上 报到 警察 局 ,而 这 其 中 又 只 有 约 32 个 信息 能 够 为 警察 记录 下 来 ; 英 
国 的 犯罪 调查 机 构 (British Crime Survey) 经 调查 统计 ,发 现 只 有 约 42% 的 
违法 活动 上 报到 了 警察 部 门 ,警察 部 门 又 只 对 其 中 约 74% 的 情况 进行 了 记 


[1) See Miller, Kevin, “ Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacy’s Perfect Storm”, Journal of Technology Law & Policy,1(2014) ,pp. 105-146. 
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警察 部 门 实际 所 记录 的 犯罪 数据 只 是 实际 犯罪 活动 的 31%。"' 犯罪 
黑 数 的 问题 无 疑 会 对 之 后 数据 分 析 结 果 产 生 影响 ,然而 犯罪 黑 数 是 人 类 犯 
罪 史 中 一 直 都 存在 的 顽疾 ,只 能 通过 不 断 提 高 接警 率 、 警 情 录 和 人 率 来 降低 
犯罪 黑 数 。 

(二 ) 大 数据 的 歧视 偏见 

相 比 于 传统 的 人 为 主观 经 验 分 析 , 大 数据 采用 科学 的 运算 方法 ,无 论 
是 分 析 过 程 还 是 数据 结果 ,看 起 来 都 更 为 客观 和 准确 。 但 其 实 并 不 然 ,从 
数据 地 收集 到 计算 模型 设计 再 到 最 后 的 数据 分 析 结 果 , 每 个 过 程 都 离 不 开 
人 为 的 设计 和 操作 ,自然 也 不 可 避免 地 夹杂 着 人 类 的 主观 价值 偏见 。 相 比 
于 传统 社会 中 的 主观 偏见 而 言 , 大 数据 所 带 来 的 偏见 和 歧视 更 加 隐蔽 和 有 灵 
活化 ,例如 在 大 数据 技术 的 帮助 下 ,广告 商 不 需要 明目张胆 地 在 广告 中 表 
达 出 他 们 对 性 别 \ 收 入 、 阶 层 等 偏见 ,只 需要 通过 大 数据 算出 潜在 客户 ,并 
有 针对 性 地 投放 广告 ,就 悄悄 完成 了 区 别 化 销售 。"? 商业 领域 的 大 数据 歧 
视 尚 且 无 可 厚 非 , 但 如 果 大 数据 “歧视 模式 ”一旦 蕊 延至 犯罪 侦查 领域 , 则 
会 严重 地 影响 公民 权利 和 司法 程序 。 

这 种 担忧 并 非 空穴来风 ,在 大 数据 侦查 中 确实 存在 歧视 及 偏见 现象 。 
这 种 偏见 往往 来 源 于 大 数据 不 同 的 操纵 者 。 在 大 数据 侦查 工具 开发 阶段 ， 
主观 偏见 来 自 于 大 数据 软件 的 设计 师 和 开发 商 ,他 们 往往 带 有 技术 性 思维 
和 利益 追逐 心理 ,而 对 司法 程序 及 相关 的 法 律 规则 不 其 了 解 , 因 而 不 排除 
大 数据 侦查 的 软件 带 有 重 技术 效果 、 轻 法 律 程 序 的 色彩 ;在 早期 数据 准备 
过 程 中 , 即 数据 的 采集 清洗 等 程序 中 ,每 一 程序 都 可 能 夹杂 着 操作 人 员 的 
主观 价值 ;在 大 数据 算法 模型 设计 过 程 中 ,技术 人 员 可 能 会 将 一 些 政策 的 


[1] Carcach,C.“Reporting crime to the police”, Australian Institute of Criminology Trends 
and Issues in Crime and Criminal Justice p. 68. 
Dodd, T. ,Nicholas, S. , Povey, D. and Walker, A. (2004). Crime in England and Wales 2003/ 
2004. 转 引 自 [ 英 ] Spencer Chainey 、[ 美 ] Jerry Ratcliffe:《 地 理 信息 系统 与 犯罪 制图 ), 陈 鹏 , 洪 卫 
军 , 隋 晋 光 等 译 ,47 页 ,北京 ,中 国人 民 公安 大 学 出 版 社 ,2014。 

[2] See Crawford,Kate ,Schultz,Jason,“Big Data and Due Process: Toward a Framework 
to Redress Predictive Privacy Harms” , Boston College Law Review ,1(2014) ,pp. 93-128. 
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价值 需求 编 入 数据 算法 中 ,形成 一 种 隐藏 的 价值 偏见 ,并 通过 科学 计算 为 
这 种 政策 上 的 偏见 披 上 合理 的 外 衣 。 而 到 了 大 数据 的 实务 侦查 应 用 中 ,前 
述 的 这 些 偏 见 会 被 放大 ,即使 是 再 小 的 偏见 ,一 旦 运用 至 司法 程序 中 ,所 造 
成 的 影响 和 损害 也 是 无 可 估量 的 ."1 还 有 学 者 认为 大 数据 侦查 中 的 歧视 
与 其 本 身 的 算法 有 一 定 关系 ,基于 数据 算法 的 特点 ,大 数据 本 身 很 有 可 能 
陷入 其 自身 所 造成 的 “数据 怪圈 ”(self-fulfilling cycles of bias)。 例 如 , 根 
据 大 数据 预测 某 一 区 域 是 犯罪 热点 ,警方 进而 加 强 对 该 地 区 的 警备 投入 ， 
并 抓获 更 多 的 犯罪 分 子 , 使 得 这 一 区 域 的 逮捕 率 和 破案 率 迅 速 上 升 。 从 表 
面 上 看 ,似乎 印证 了 大 数据 预测 型 侦查 的 准确 性 ,但 该 区 域 逮捕 率 、 破 案 率 
的 上 升 有 可 能 只 是 警力 资源 投入 加 大 的 结果 ; 反 过 来 , 较 高 逮捕 率 、 破 案 率 
数据 又 使 得 该 地 区 在 大 数据 分 析 过 程 中 进一步 被 确定 为 “热点 地 区 ”。 总 
而 言 之 ,大 数据 侦查 算法 容易 陷入 一 种 怪圈 ,造成 数据 结果 上 的 假象 ,反倒 
对 侦查 造成 误导 。2” 

在 侦查 中 ,大 数据 偏见 会 进一步 投射 到 某 些 地 区 、 人 和 群 中 。 在 地 域 上 ， 
大 数据 视野 下 的 低 收入 地 区 、 外 来 人 口 聚 居 区 、 城 中村、 城乡 接合 部 等 地 区 
容易 成 为 高 危 犯罪 地 区 。 在 人 群 上 ,具有 某 些 身份 特征 的 人 群 会 成 为 高 危 
分 子 。 例 如 在 美国 ,由 于 种 族 偏见 的 存在 ,传统 侦查 中 黑人 的 犯罪 率 本 就 
高 于 白人 ,' 引 在 这 种 背景 下 ,大 数据 分 析 很 可 能 会 加 剧种 族 歧视 ,其 至 以 


[1] See Miller, Kevin,“Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacy’s Perfect Storm”, Joural of Technolongy Law 8 Policy ,1(2014) ,pp. 105-146. 

[2] See Kelly K. Koss,“ Leveraging Predictive Policing Algorithms to Restore Fourth 
Amendment Protections in High-Crime Areas in a Post-Wardlow World”, Chicago Kent Law 
Review ,1(2015) ,pp. 301-334. 

53] 据 统计 ,在 每 十 万 个 囚犯 中 ,平均 有 478 名 白人 男性 .3023 名 黑人 男性 ,51 名 白人 女性 、 
129 名 黑人 女性 。HUMAN RIGHTS WATCH, A NATION BEHIND BARS: A HUMAN 
RIGHTS SOLUTION 5 (2014) ,http://www. hrw. org/sites/defaultVfiles/related-material/2014 _ 
USNationBehindBars_0. pdf (citation omitted) . 
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“科学 化 ?方式 显示 出 黑人 更 具有 人 身 危险 性 .更 具有 犯罪 的 可 能 性 .5 

更 严重 的 是 ,大 数据 的 “偏见 和 歧视 ”还 容易 产生 “群体 性 "有罪 偏见 。 
一 旦 对 特定 的 人 群 和 地 区 打上 犯罪 特征 的 标签 之 后 ,侦查 人 员 便 难以 避免 
地 会 对 该 人 群 .该 地 区 产生 整体 偏见 ,甚至 是 带 有 有 罪 推定 的 心理 。 然 而 ， 
犯罪 分 子 毕竟 只 是 少数 分 子 , 即 使 是 在 犯罪 高 危 地 区 也 有 大 量 遵 纪 守 法 的 
公民 ,犯罪 地 域 化 的 标签 会 无 形 之 中 影响 他 们 的 社会 评价 。 此 外 ,针对 高 
危 犯罪 人 群 和 高 危 犯 罪 地 区 ,警方 必定 会 加 大 对 该 人 群 , 该 地 区 的 侦查 资 
源 分 配 , 加 强 对 该 地 区 的 警 务 防备 工作 ,造成 差别 化 执法 ,无 形 中 对 该 地 
区 ,该 人 群 造成 一 定 的 心理 压力 ,对 其 正常 的 生活 带 来 一 定 干扰 ,导致 民众 
与 警方 关系 的 紧张 。 

(三 ) 数据 分 析 的 错误 

大 数据 分 析 流 程 包括 主题 的 确定 、 数 据 的 集成 .数据 的 建 模 运算 以 及 
数据 可 视 化 等 一 系列 环节 ,大 数据 分 析 的 每 一 阶段 都 离 不 开 人 为 的 操作 ， 
每 一 环节 都 具有 出 错 的 可 能 ,每 一 处 操作 失误 都 有 可 能 影响 最 终 的 数据 分 
析 结 果 。@ 主 题 的 确定 是 大 数据 分 析 的 前 提 。 首 先 需 要 明确 待 解决 的 问 
题 ,如 果 对 大 数据 分 析 的 主题 问题 没有 全 面 、 明 确 的 认识 , 则 很 有 可 能 导致 
后 面 的 数据 集成 ,数据 分 析 环 节 产 生 偏差 。@ 主题 确定 之 后 需要 进行 数据 
集成 。 数 据 集成 是 指 将 不 同 来 源 的 数据 进行 整合 的 过 程 , 包 括 提取 、 变 换 
和 装载 三 个 步骤 .52?3 数据 集成 阶段 涉及 数据 源 的 选择 .数据 清洗 等 问题 ， 
一 旦 在 数据 集成 环节 出 错 , 则 会 导致 数据 的 不 完整 .不 稳定 ,影响 用 以 分 析 
的 数据 源 质量 。@ 在 数据 建 模 运算 阶段 ,需要 选择 合适 的 算法 进行 数据 分 
析 , 如 聚 类 算法 .关联 性 算法 .时 序 算 法 等 。 尽 管 大 数据 算法 具有 智能 性 ， 
解放 了 人 类 脑力 劳动 ,但 是 数据 模型 毕竟 是 人 工 设 计 的 ,任何 一 个 算法 、 参 


[1] See Ferguson, Andrew Guthrie, “ Big Data and Predictive Reasonable Suspicion”, 
University of Pennsylvania Law Review ,2 (2015) ,pp. 327-410. 
“An officer conditioned to believe that a particular type of person may be more likely to commit a 
criminal act will likely see that person through the lens of suspicion. By providing the information to 
confirm this suspicion ,big data will make it easier for police to justify a stop.” 


52] 李 学 龙 :《 大 数据 系统 综述 》, 载 (中 国 科 学 : 信息 科学 》,2015(1)。 
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数 的 不 准确 ,都 会 导致 分 析 结 果 误 差 ,不同 分 析 师 针对 同一 主题 所 算出 的 
结果 也 会 有 所 差异 。 男 外 ,这 里 还 有 一 个 法 律 语言 与 数据 算法 代沟 的 问 
题 ,大 数据 分 析 师 一 般 都 不 具备 法 律 背 景 知识 ,不 一 定 能 够 将 侦查 的 法 律 
需求 准确 地 用 数据 算法 表达 出 来 ;在 涉及 一 些 法 律 程 序 、 法 律 规则 的 时 候 ， 
数据 算法 能 否 准 确 理解 ,翻译 法 律 语言 ,也 是 需要 考虑 的 问题 。 

另外 ,大 数据 算法 中 还 有 一 对 不 可 避免 的 误差 , 即 数 据 的 假 阴 性 与 假 
阳性 之 间 的 矛盾 。 假 阴性 与 假 阳性 来 源 于 数据 统计 学 中 的 基本 错误 率 
(base rate fallacy) ,它们 是 一 对 此 消 彼 长 的 矛盾 ,即使 优化 数据 分 析 挖 掘 技 
术 , 也 不 能 完全 避免 这 对 矛盾 的 产生 .2 大 数据 侦查 算法 中 同样 面临 这 对 
矛盾 。 大 数据 侦查 算法 的 假 阴 性 是 指 将 犯罪 结果 遗漏 , 即 没有 检测 出 犯罪 
结果 ,这 有 可 能 导致 * 漏 罪 ”; 而 大 数据 侦查 算法 的 假 阳 性 是 指 分 析 结 果 错 
误 , 误 将 无 吉之 人 错 认 为 有 犯罪 嫌疑 甚至 有 罪 。 在 一 般 的 数据 统计 中 , 数 
据 的 假 阴 性 和 假 阳性 可 能 无 足 轻 重 , 但 是 在 司法 程序 中 ,即使 是 再 轻微 的 
数据 偏差 ,都 有 可 能 造成 事实 认定 错误 及 司法 不 公 , 尤 其 是 “ 假 阳性 ?错误 
有 可 能 将 无 罪 之 人 认定 为 有 罪 。 因 此 ,在 大 数据 侦查 中 要 秉持 一 种 防范 宽 
假 错案 的 法 治理 念 ,“ 宁 可 错 放 10 个 ,也 不 错 判 1 个 ”, 将 大 数据 侦查 算法 中 
的 假 阳性 概率 降低 至 最 小 。 

实务 中 ,大 数据 分 析出 错 的 事例 也 屡见不鲜 。 美 国 的 “ 禁 飞 系统 ”经 常 
将 无 事 者 误 判 断 为 恐怖 分 子 , 从 2003 年 到 2006 年 至 少 发 生 过 5000 次 的 识 
别 错误 ,这 些 错 误 来 源 于 数据 库 的 数据 错误 以 及 识别 算法 的 错误 ;5?) 美 国 
还 有 一 个 名 为 “可 疑 活 动 报告 系统 ”(The Suspicious Activity Reporting ， 
SAR) ,其 建立 了 一 个 犯罪 嫌疑 人 黑 名 单 ,截至 2010 年 12 月 ,名 单 上 共有 
161 948 名 犯罪 嫌疑 人 ,但 最 终 只 对 103 人 展开 了 刑事 调查 ,5 人 被 逮捕 , 仅 


[1] See Miller, Kevin, “ Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacy’s Perfect Storm” ,Journal of Technology Law & Policy ,1(2014) ,pp. 105-146. 

C2) Citron, Danielle Keats, “ Technological Due Process”, Washington University Law 
Review ,6 (2008) ,pp. 1249-1314. 
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有 1 人 被 判处 有 罪 .“1 总 而 言 之 ,大 数据 分 析 流程 是 一 个 精妙 的 系统 ,从 
数据 来 源 .数据 集成 数据 清洗 到 数据 分 析 的 每 一 环节 、 每 一 算法 的 参数 都 
有 可 能 对 最 终 的 分 析 结 果 造 成 影响 。 在 商业 、 金 融 等 其 他 领域 ,大 数据 分 
析 的 错误 会 造成 经 济 上 的 损失 以 及 管理 成 本 的 提高 ;然而 对 于 犯罪 侦查 领 
域 而 言 ,大 数据 分 析 结 果 的 准确 与 否 关 系 到 犯罪 活动 的 侦破 ,关系 到 罪 与 
非 罪 的 判断 ,关系 到 公民 人 身 权利 、 财 产权 利 等 人 权 保 障 的 问题 。 因 而 , 确 
保 大 数据 分 析 过 程 的 严 间 ,准确 应 当成 为 大 数据 侦查 工作 中 的 重点 问题 。 

(四 ) 数据 模型 的 失灵 

事物 本 身 发 展 的 不 确定 性 也 会 造成 数据 分 析 结 果 错 误 。 大 数据 方法 
尽管 是 “用 数据 发 声 ”, 但 是 仍然 建立 在 事物 本 身 发 展 的 基础 之 上 ,数据 分 
析 结 果 的 准确 与 否 还 取决 于 分 析 模 型 能 否 适应 事物 的 发 展 变 化 趋势 。 然 
而 在 实践 中 事物 的 发 展 尽管 有 律 可 循 ,但 也 不 排除 会 产生 一 些 不 确定 的 变 
化 ,这 种 数据 的 不 确定 性 就 会 导致 数据 分 析 模 型 的 失 录 。 例 如 ,著名 的 谷 
歌 流感 指数 (Google Flu Trends), 其 对 流感 的 预测 一 直 保 持 较 高 的 准确 
度 , 但 2009 年 的 HIN1 和 2013 年 H7N9 病毒 的 爆发 使 得 谷歌 流感 指数 的 
运算 模型 无 法 应 对 突 发 情况 ,对 流感 指数 的 估 值 严重 偏离 了 官方 统计 的 
数据 。527 

大 数据 侦查 中 同样 会 面临 数据 模型 失灵 问题 。 尽 管 多 数 犯 罪 活动 有 
着 一 定 的 规律 性 ,但 犯罪 活动 本 身 就 具有 随机 性 和 不 确定 性 ,总 会 存在 一 
些 非典 型 的 例外 情况 ,这 就 会 导致 既 有 的 数据 模型 无 法 识别 ; 随 着 科技 的 
进步 和 世界 形势 的 变化 ,犯罪 活动 还 会 出 现 新 的 方式 、 新 的 手段 ,这 些 新 的 
犯罪 类 型 也 难以 被 既 有 的 大 数据 模型 所 识别 出 来 ;此 外 ,有 些 犯罪 分 子 的 
过 强 的 反 侦查 行为 也 会 导致 一 些 数 据 之 间 的 联系 被 人 为 切断 ,造成 数据 模 


[1] See Miller, Kevin,“Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacyys Perfect Storm”, Journal of Technology Law & Policy,1 (2014) ,pp. 105-146. 

[2] 参见 (流感 防治 和 大 数据 ). 载 外 滩 画报 网 https://www. baidu. com/link? url== NPhc2 
v12NwSpGWakcE4IdXSmoBsrYnEnYOCf4FKQ30dpcLqckaoIEBq5RKzTLr3tXylYOafGhMkz-Bqm 
gqyyfa&. wd 一 & eqid 一 b3521471000923d90000000355fcdlal, 最 后 访问 时 间 : 2016 年 9 月 28 日 。 
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型 对 犯罪 活动 识别 的 障碍 .5 23 应 对 事物 发 展 不 确定 性 的 办 法 之 一 就 是 及 
时 更 新 数据 及 数据 模型 ,对 事物 发 展 状况 进行 实时 追踪 ,通过 大 数据 挖掘 
技术 尽早 识别 出 事物 变化 发 展 的 趋势 。 


四 、 相关 性 可 以 替代 因果 性 


大 数据 之 父 舍 恩 伯 格 认为 ,在 大 数据 时 代 人 们 应 当 更 关注 数据 之 间 的 
相关 性 而 非 因果 性 。 一 直 以 来 ,因果 关系 的 证 明 都 是 一 件 比 较 困 难 的 事 
情 , 大 数据 完全 从 另 一 条 路 径 出 发 ,直接 去 探寻 事物 之 间 的 相关 关系 ,并 且 
很 多 时 候 知 道 相关 关系 就 已 经 足够 了 。 但 相关 性 的 这 一 理论 颠覆 了 人 类 
长 久 以 来 形成 的 因果 关系 思维 ,其 合理 性 还 有 待考 证 。 如 有 学 者 就 对 这 一 
思潮 提出 了 批判 ,其 认为 大 数据 技术 本 身 是 中 立 的 ,相关 关系 的 作用 被 某 
些 实用 主义 者 过 度 鼓 吹 。"?) 

的 确 , 在 商业 等 领域 由 于 对 于 利润 的 追求 ,相关 性 比 因果 性 能 够 更 快 
地 带 来 决策 的 改进 和 收益 的 增加 。 然 而 ,能 否 在 犯罪 侦查 、 司 法 证 明 领 域 
适用 大 数据 “相关 性 ”思维 ?笔者 认为 需要 三 思 而 后 行 。 尽 管 侦查 中 也 强 
调 要 具有 相关 性 ,但 是 “此 相关 性 ” 非 “ 彼 相关 性 ”。 侦 查 中 的 相关 性 是 一 种 
建立 在 人 类 因果 人 逻辑 基础 上 的 “ 强 相关 性 ”, 而 大 数据 的 相关 性 却 是 建立 在 
机 器 计算 基础 上 的 * 弱 相关 性 ”; 因果 关系 是 相关 关系 的 一 种 ,而 相关 关系 
却 并 不 尽 然 是 因果 关系 。 实 际 上 ,犯罪 侦查 以 及 司法 证 明 模 式 一 直 建 立 在 
人 类 传统 的 因果 思维 基础 上 ,要 求 续 密 的 逻辑 体系 、 经 得 起 因果 关系 的 检 
验 ,严格 的 司法 程序 不 仅仅 是 为 了 准确 认定 事实 ,更 是 对 公民 生命 .自由 、 
财产 等 权益 的 保障 。 因 此 ,不 能 用 大 数据 的 相关 性 去 代替 侦查 .司法 证 明 
中 的 相关 性 。 

但 这 绝 不 是 要 否认 大 数据 的 相关 性 在 犯罪 侦查 中 的 作用 ,即使 只 告 i 
我 们 是 什么 而 不 解释 为 什么 ,这 种 结果 主义 的 相关 性 仍然 会 给 侦查 工作 带 


51] 崔 凯 :《 再 造 公 安 情报 》,500 一 501 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2008 。 
52] [ 英 ] 维 克 托 。 迈 尔 - 舍 恩 伯 格 , 肯 尼 斯 。 库 克 耶 :《 大 数据 时 代 ), 盛 杨 燕 ,周涛 译 , 译 者 序 
部 分 (周涛 ) ,杭州 ,浙江 人 民 出 版 社 ,2013。 
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来 很 多 新 的 视角 。 

第 一 ,侦查 人 员 可 以 在 相关 性 基础 上 去 寻找 因果 关系 。 如 在 “啤酒 和 
尿布 "故事 中 ,大 数据 告诉 超市 啤酒 和 尿布 放 在 一 起 卖 得 更 好 ,但 是 数据 无 
法 算出 这 其 中 的 原因 。 经 人 工 进一步 分 析 , 原 来 是 因为 一 些 年 轻 的 爸爸 在 
给 宝宝 买 尿布 的 同时 ,也 会 顺手 买 两 钠 啤 酒 作为 自己 的 奖励 。 与 此 同 理 ， 
在 犯罪 侦查 中 侦查 人 员 同 样 可 以 在 相关 性 基础 上 寻找 因果 关系 ,从 相关 关 
系 中 找到 一 些 重要 的 变量 ,并 用 于 验证 因果 关系 的 试验 中 去 ,如 果 能 够 经 
受 司法 证 明 因果 人 逻辑 的 检验 ,可 以 在 此 基础 上 进行 传统 的 证 据 调查 ,"17 例 
如 将 大 数据 技术 运用 于 内 幕 交 易 行 为 监测 ,系统 会 发 出 很 多 预警 信息 ,但 
是 并 不 是 每 一 个 警报 的 后 面 必然 是 内 幕 交 易 行 为 ,指数 的 异常 有 可 能 具有 
合理 的 行为 解释 ,但 监管 人 员 可 以 在 警报 的 基础 上 进一步 去 查证 真正 的 内 
幕 交 易 行 为 。 

第 二 ,侦查 人 员 可 以 通过 相关 性 寻找 更 多 的 线索 .证 据 。 并 不 是 任何 
两 个 事物 之 间 的 相关 性 都 能 够 经 受 因 果 逻 辑 的 检验 ,同样 侦查 过 程 中 很 多 
相关 现象 也 无 法 找到 它们 之 间 确 切 的 因果 关系 。 但 是 我 们 却 可 以 以 此 为 
线索 ,去 寻找 其 他 证 据 材 料 以 印证 ,拓展 新 的 侦查 思路 。 这 种 方法 目前 在 
侦查 实务 中 已 经 得 到 了 广泛 的 应 用 ,例如 在 职务 犯罪 侦查 案件 中 ,通过 话 
单数 据 挖掘 筛选 嫌疑 人 的 高 频 联 系 人 ,他 们 可 能 是 其 他 犯罪 嫌疑 人 ,也 可 
能 只 是 嫌疑 人 的 亲友 ,侦查 人 员 可 以 在 此 基础 上 对 几 位 联系 人 进行 进一步 
调查 分 析 ,确认 他 们 之 间 是 否 有 利益 关系 、 存 在 行贿 受贿 的 可 能 性 。 

第 三 ,侦查 人 员 可 以 在 相关 性 基础 上 发 挥 犯罪 监控 .犯罪 预测 功能 。 
“找到 一 个 关联 物 并 监测 它 , 我 们 就 能 预知 未 来 ”, 舍 恩 伯 格 的 这 一 观点 大 
大 拓展 了 犯罪 侦查 的 思路 和 方法 。 尤 其 是 大 数据 的 预测 性 功能 将 事后 侦 
查 转变 为 事前 的 犯罪 预防 ,通过 大 数据 算法 时 刻 监控 、 识 别 异常 的 违法 犯 
罪 现 象 ,在 犯罪 尚未 发 生 之 时 便 阻 止 它 。 因 而 ,在 很 多 对 犯罪 行为 本 身 不 
好 直接 观察 的 情况 下 ,可 以 找到 它 的 关联 物 并 进行 监控 。 并 且 , 随 着 平行 


C1] 高 波 :《 从 制度 到 思维 : 大 数据 对 电子 数据 收集 的 影响 与 应 对 》, 载 (大 连理 工大 学 学 报 》 
(社会 科学 版 ) ,2014(2) 。 
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数据 空间 的 形成 , 越 来 越 多 的 事物 都 已 经 具备 寻找 关联 数据 的 条 件 。 例 如 
在 职务 犯罪 案件 查处 过 程 中 ,从 嫌疑 人 本 身 着 手 可 能 难以 发 现 犯罪 线索 ， 
但 侦查 人 员 可 以 从 与 职务 犯罪 相关 的 现象 人手 ,选取 与 职务 犯罪 相关 的 数 
据 进 行 分 析 , 如 出 入 境 数据 、 高 档 消费 场所 数据 、 房 地 产 交 易 数 据 中 可 能 就 
存在 着 与 职务 犯罪 相关 的 数据 。 对 这 些 数据 进行 实时 监测 ,有 利于 及 时 识 
别 职务 犯罪 线索 .发现 犯罪 苗头 ,起 到 一 定 的 监控 ,预测 犯罪 的 效果 。 


五 、 预 测 性 违背 无 罪 推 定 原则 


预测 是 大 数据 最 重要 的 价值 ,建立 在 预测 思维 基础 之 上 的 “犯罪 预测 ” 
也 是 大 数据 侦查 的 重要 组 成 部 分 。 随 着 大 数据 技术 的 成 熟 , 犯 罪 预 测 将 不 
再 是 难题 ,警方 可 能 会 在 越 来 越 多 的 犯罪 活动 发 生 之 前 就 将 其 阻止 。 在 大 
数据 侦查 的 预测 思维 下 ,很 多 人 产生 这 样 的 认识 一 一 大 数据 预测 性 思维 与 
刑事 诉讼 法 中 “无 罪 推 定 ” 原 则 形成 了 悖 论 。 具 体言 之 ,如 果 侦 查 人 员 在 犯 
罪 活 动 发 生 之 前 就 将 其 阻止 ,那么 事实 上 犯罪 活动 并 没有 开始 ,无 论 大 数 
据 预测 技术 有 多 么 精准 ,犯罪 事实 终究 是 没有 发 生 , 预 测 结果 永远 无 法 得 
到 证 实 。 在 此 过 程 中 ,侦查 人 员 并 没有 看 到 犯罪 活动 发 生 ,也 没有 直接 证 
据 能 够 证 明 犯 罪 活动 的 发 生 , 仅 仅 是 根据 大 数据 的 预测 结果 便 对 某 个 * 犯 
罪 嫌疑 人 ”产生 有 罪 推 断 甚至 是 采取 相关 措施 。 如 果 只 是 阻止 犯罪 而 不 采 
取 惩 罚 措 施 ,嫌疑 人 则 有 可 能 再 次 犯罪 ;而 一 旦 采取 惩罚 措施 , 则 是 对 未 来 
犯罪 行为 的 惩罚 ,违背 了 程序 法 中 无 罪 推定 的 基本 原则 。" ?7 

无 罪 推 定 原则 是 现代 刑事 诉讼 的 最 重要 支撑 理论 之 一 ,是 指 在 未 经 依 
法 有 罪 判 决 之 前 ,任何 人 都 应 当 被 视 为 无 罪 。 早 在 18 世纪 ,意大利 亚 著 名 
法 学 家 贝 卡 利 亚 就 已 经 提出 了 无 罪 推定 原则 .5?2 无 罪 推定 原则 作为 现代 
刑事 诉讼 的 基石 ,其 实际 上 是 一 种 价值 论 ,是 一 种 法 律 拟 制 : 无 罪 推 定 原则 
并 不 否认 人 们 的 主观 认识 可 能 与 其 不 同 ,而 是 要 求人 们 的 法 律 判 断 应 受 其 


51] 徐 继 华 , 冯 启 娜 , 陈 贞 汝 :《 智 慧 政 府 : 大 数据 治国 时 代 的 来 临 》,233 页 ,北京 ,中 信 出 版 社 ， 
2014。 高 波 :《 大 数据 : 电子 数据 证 据 的 挑战 与 机 遇 》, 载 (重庆 大 学 学 报 (社会 科学 版 )》,2014(3) 。 
52] [ 意 ] 贝 卡 利 亚 :《 论 犯罪 与 刑罚 》, 黄 风 译 ,37 页 ,北京 ,中 国法 制 出 版 社 ,2014。 
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约束 ."' 大 数据 预测 侦查 中 , 侦查 人 员 根 据 数 据 分 析 结果 而 采取 相关 措 
施 , 是 基于 侦查 机 关 行 使 职权 的 需求 及 大 数据 预测 的 技术 特征 ,并 非 是 从 
理念 上 去 否定 无 罪 推定 原则 。 相 反 , 无 罪 推定 原则 能 够 指导 大 数据 预测 侦 
查 在 法 治 程序 中 更 好 地 展开 。 制 定 保障 嫌疑 人 权利 的 诉讼 程序 是 无 罪 推 
定 原则 的 应 有 之 义 , 据 此 ,可 以 通过 具体 制度 的 设计 来 构建 大 数据 预测 侦 
查 的 法 定 程序 。 具 体言 之 ,通过 大 数据 算法 来 对 不 同 犯罪 分 子 风险 进行 评 
佑 ,赋予 其 不 同 的 风险 等 级 ,结合 案件 的 种 类 及 犯罪 分 子 风 险 的 大 小 来 采 
取 不 同 的 侦查 措施 ,确保 侦查 措施 适用 的 * 谦 抑 性 ”。 对 于 人 身 危害 性 小 或 
犯罪 概率 较 低 的 嫌疑 分 子 , 可 以 实行 重点 人 口 管 控 , 由 当地 的 居委会 、 治 安 
人 员 对 其 进行 监控 并 及 时 向 公安 机 关 反 映 ;对 于 人 身 危 险 性 较 严 重 或 犯罪 
概率 较 大 的 嫌疑 分 子 , 应 当 实行 重点 监控 措施 ,如 安排 刑事 特 情 进 行 监控 ， 
对 其 进行 盘问 、 检 查 等 。 不 过 笔者 认为 ,在 犯罪 预测 阶段 .犯罪 行为 尚未 发 
生 之 时 ,始终 不 宜 对 “危险 分 子 ” 采 取 侵 犯 其 人 身 自由 等 重大 权益 的 侦查 措 
施 。 另 外 ,要 防止 出 现 数据 独裁 现象 ,即使 大 数据 预测 结果 显示 犯罪 发 生 
的 风险 等 级 较 高 ,有 必要 对 “和 危险 分 子 ” 采 取 较 强 的 侦查 措施 ,侦查 人 员 也 
必须 结合 物证 .电子 数据 等 其 他 传统 证 据 , 形 成 相互 印证 的 证 据 体 系 , 不 能 
只 依据 大 数据 预测 结果 便 采取 相关 措施 。 


第 三 节 大 数据 侦查 思维 对 司法 证 明 的 影响 


司法 证 明 是 指 在 诉讼 中 ,抗辩 双方 提出 证 据 并 说 服 法 官 相信 己方 事实 
主张 的 过 程 。'?? 司法 证 明 可 以 分 为 自 向 证 明和 他 向 证 明 。 一 般 人 会 理解 
为 只 有 在 审判 阶段 才 需 要 司法 证 明 , 其 实 不 然 , 司 法 证 明 贯 穿 于 整个 诉讼 
过 程 中 。 在 侦查 环节 ,侦查 人 员 主 要 进行 的 是 自 向 证 明 , 即 寻找 证 据 去 证 
明 自 己 的 事实 认定 是 正确 的 。 即 使 是 自 向 证 明 , 同 样 应 当 遵 循 司法 证 明 的 
基本 原理 ,并 且 侦 查 环节 的 证 明 是 否 充 分 ,也 决定 了 在 审查 起 诉 、 审 判 中 的 





C51] 张 令 杰 ,张强 , 王 敏 远 :《 论 无 罪 推定 原则 》, 载 (法 学 研究 》,1991(4) 。 
52] 何 家 弘 , 刘 品 新 :《 证 据 法 学 ),194 页 ,北京 ,法 律 出 版 社 ,2013 。 
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相关 事实 认定 是 否 立 得 住 脚 。 在 这 一 过 程 中 ,大 数据 侦查 的 思维 特征 同样 
也 会 对 传统 的 司法 证 明 原 理 产 生 影响 ,尤其 是 相关 性 思维 对 司法 证 明 的 相 
关 性 要 求 和 传统 证 明 标准 产生 影响 。 本 节 也 针对 这 两 个 问题 展开 分 析 。 


一 、 对 传统 司法 证 明 相 关 性 的 影响 


传统 的 司法 证 明 中 ,要 求证 据 与 待 证 事实 之 间 具 有 关联 性 ,这 种 关联 
性 也 是 司法 证 明 的 基础 逻辑 。《 美 国联 邦 证 据 规则 ) 第 401 条 对 关联 性 有 
着 最 经 典 的 解释 : 相 比 于 没有 该 证 据 而 言 , 该 证 据 能 够 使 得 某 事实 更 可 能 
存在 或 者 更 不 可 能 存在 的 任何 趋向 ,并 且 该 事实 对 于 确定 诉讼 具有 重要 意 
义 513 根 据 华 尔 效 教授 的 观点 ,关联 性 更 强调 对 案件 中 实质 问题 的 证 明 作 
用 ;52?2 还 有 学 者 认为 证 据 不 仅 要 具有 实质 关联 性 ,在 载体 和 形式 上 也 要 具 
有 关联 性 .531 但 是 无 论 学 界 对 于 司法 证 明 关联 性 采取 何 种 认定 标准 ,其 都 
不 同 于 大 数据 的 “相关 性 ”。 司 法 证 明 的 关联 性 是 建立 在 小 数据 时 代 的 因 
果 关 系 认 知 方式 的 基础 上 ,其 本 质 上 是 一 种 因果 关系 。 结 合 大 数据 侦查 的 
思维 特征 ,本 节 从 以 下 两 个 方面 探讨 大 数据 的 相关 性 对 传统 证 明 中 相关 性 
的 影响 。 

(一 ) 关联 数据 的 相关 性 

“找到 一 个 关联 物 并 监测 它 ” 是 大 数据 的 经 典 理论 之 一 。 大 数据 可 以 
找到 某 个 现象 的 良好 关联 物 ,通过 对 关联 物 的 分 析 来 观测 现象 本 身 。 这 一 
原理 同样 可 以 在 侦查 领域 运用 。 如 果 A 和 B 经常 一 起 发 生 , 我 们 只 要 注意 
到 B 发 生 了 ,就 可 以 预测 A 也 发 生 了 。 那 么 在 司法 证 明 中 ,如 果 A 事实 的 
证 据 难以 获取 ,但 是 B 与 A 之 间 有 相关 性 ,那么 是 否 可 以 通过 对 B 事实 的 
证 明 来 证 明 A 事实 呢 ? 进一步 分 析 , 假 设 BB 能够 证 实 ,但 是 A 与 BB 之 间 的 
关联 性 是 通过 数据 运算 所 得 出 的 ,那么 A 与 B 之 间 的 关联 性 是 否 站 得 住 


51] 王 进 喜 :《 美 国 (联邦 证 据 规 则 (2011 年 重 塑 版 ) 条 解 》),56 页 ,北京 ,中 国法 制 出 版 社 ， 
2012。 

52] 易 延 友 :《 美 国联 邦 证 据 规则 中 的 关联 性 》, 载 (环球 法 律 评论 》,2009(6) 。 

C3] 邱 爱 民 :《 论 证 据 关联 性 的 界定 与 判定 》, 载 (扬州 大 学 学 报 》( 人 文 社 会 科学 版 ) ,2009 
(6) 。 
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大 数据 的 “相关 性 ” 
A 事 实 一 -一 B 事 实 


? 证 据 X 


脚 呢 ? 

笔者 认为 ,刑事 司法 证 明 关 涉 公民 的 生命 .自由 等 重要 权利 ,不 能 直接 
用 数理 的 相关 性 去 替代 基于 人 类 经 验 的 司法 证 明 因 果 关 系 。 如 果 A 和 也 
仅仅 是 数理 上 的 相关 性 , 则 不 能 通过 对 B 事实 的 证 明 来 证 明 A 事实 。 但 是 
B 事 实 可 以 为 A 事实 的 证 明 提供 相关 线索 ,或 者 在 A 事实 与 也 事实 之 问 进 
一 步 寻 找 因果 关系 的 解释 。 例 如 ,通过 对 海量 微 信 诈 骗 案件 进行 大 数据 分 
析 ,发 现 欺诈 账号 与 广西 宾 阳 之 间 存 在 密切 联系 ,八成 以 上 的 微 信 诈骗 来 
自 广西 宾 阳 ,那么 在 这 里 微 信 欺诈 与 广西 宾 阳 之 间 就 是 关联 现象 。 假 设 警 
方 现在 证 实 了 一 起 微 信 诈 骗 账 号 ,但 不 能 就 此 直接 判断 作案 者 就 一 定 来 自 
广西 宾 阳 ,不 过 可 以 将 此 作为 线索 ,从 广西 宾 阳 籍 人 群 中 展开 摸排 ,进一步 
寻找 二 者 间 的 因果 关系 。 

(二 ) 衍生 数据 的 相关 性 

在 大 数据 侦查 中 ,通过 大 数据 技术 所 获取 的 数据 结果 主要 有 两 种 形 
式 : 一 种 是 通过 大 数据 方法 在 海量 数据 中 去 寻找 与 案件 有 关 的 数据 ,这 是 
一 种 "从 大 数据 到 小 数据 ?的 过 程 ,大 数据 在 其 中 只 是 扮演 了 一 种 方法 、 技 
术 的 角色 (如 数据 碰撞 ,数据 搜索 等 方法 ) 。 这 种 方式 所 获取 的 数据 仍然 保 
持原 始 状 态 ,与 一 般 的 电子 数据 形式 无 异 , 其 与 案件 事实 的 关联 性 的 判断 
依然 可 以 遵照 传统 司法 证 明 中 的 关联 性 规则 。 另 一 种 是 通过 对 海量 原始 
数据 进行 二 次 分 析 后 所 得 出 的 衍生 数据 ,这 时 大 数据 技术 改变 了 数据 本 身 
的 状态 ,获取 的 是 对 数据 本 身 进行 再 次 分 析 后 得 出 的 衍生 数据 。 衍 生 数据 
往往 反映 人 物 行为 特征 、 事 物 发 展 规律 等 信息 ,看 似 与 案件 无 直接 联系 ,但 
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是 能 够 为 案件 侦查 提供 很 多 线索 和 突破 口 。 例 如 上 文 所 介绍 的 J 省 W 市 
通过 手机 数据 侦破 贪污 案件 ,就 是 衍生 数据 的 典型 运用 。 这 些 衍生 性 数据 
往往 与 案件 存在 微弱 的 联系 ,它们 能 够 对 案件 事实 的 证 明 起 到 一 定 作 用 ， 
但 又 不 同 于 传统 意义 上 建立 在 因果 关系 基础 上 的 相关 性 ,正如 有 学 者 所 
云 : 这 些 数据 与 案件 存在 着 若 有 若 无 的 关系 (potentially relevant) ,但 是 并 
不 能 直接 有 效 地 去 证 明 有 罪 或 是 无 罪 (not particularly probative of 
innocence or guilt) ,这 种 相关 性 并 非 是 传统 意义 上 的 “关联 性 ?522 那么 衍 
生 数 据 的 关联 性 站 得 住 脚 吗 ? 

笔者 认为 ,鉴于 目前 大 数据 相关 性 理论 尚 不 成 熟 ,还 不 能 直接 将 衍生 
数据 的 关联 性 与 传统 证 据 的 关联 性 等 同 ,不 宜 直接 赋予 其 证 据 地 位 ,但 又 
不 能 忽略 这 类 衍生 数据 的 作用 。 进 一 步 假设 ,在 相关 理论 发 展 成 熟 之 际 ， 
或 许可 以 参照 英美 法 中 的 “品格 证 据 *" 和 “习惯 证 据 ”" 规 则 来 确定 这 类 衍生 
数据 的 可 采 性 。 品 格 证 据 是 指 一 个 人 诚实 与 否 、 温 和 与 否 等 性 格 , 它 往往 
带 有 道德 评价 的 色彩 ;而 习惯 证 据 是 指 某 个 人 在 行为 方式 上 具有 某 种 倾 
向 ,特定 情况 下 的 行为 具有 一 贯 性 ,习惯 证 据 一 般 是 中 立 的 .'? 大 数据 分 
析 所 得 出 的 衍生 数据 恰恰 能 够 反映 出 一 个 人 的 品行 .性 格 倾向 .行为 习惯 
等 情况 , 某 种 意义 上 其 与 传统 的 “品格 证 据 ” 及 “习惯 证 据 "* 有 相似 之 处 。 不 
过 传统 的 品格 证 据 及 习惯 证 据 一 般 是 以 主观 的 形态 所 呈现 ,3 而 衍生 数据 
则 是 通过 科学 计量 的 方式 所 得 出 。 按 照 英美 证 据 法 规则 ,习惯 证 据 一 般 具 
有 可 采 性 ,而 品格 证 据 的 使 用 则 有 着 严格 的 限制 。 品 格 证 据 由 于 不 具备 必 
然 的 关联 性 ,一 般 情况 下 应 当 排 除 ;特定 情况 下 ,品格 证 据 能 发 挥 “ 有 限 采 


[1) See Brandon L. Garrett, “Big Data and Due Process”, Cornell Law Review Online, 
pp. 207-216. “A wide range of electronic information (and less and less information is not electronic 
in some fashion) may be potentially relevant,but not particularly probative of innocence or guilt.” 

52] 王 进 喜 : 《美国 (联邦 证 据 规则 )(2011 年 重 塑 版 ) 条 解 ),77 一 93 页 ,北京 ,中 国法 制 出 版 
社 ,2012。 

53] 《联邦 证 据 法 ) 规 制 第 405 条 规定 ,证 明 品 格 的 方法 有 声望 ,意见 或 具体 行为 实例 。 在 
Loughan v。 Firestone Tire and Rubber Company 一 案 中 (749 F. 2d 1519) ,是 通过 证 人 证 言 的 形式 
来 证 明 上 诉 人 具有 饮酒 的 行为 习惯 。 
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纳 ” 的 证 明 价 值 ,如 对 犯罪 构成 要 件 以 外 的 犯罪 事实 进行 证 明 , 对 证 人 、 被 
告 人 以 及 被 害 人 品格 的 证 明 等 ."1 因而 ,笔者 认为 在 相关 理论 和 实务 运用 
成 熟 之 际 ,对 于 与 品格 及 行为 习惯 相关 的 衍生 数据 ,可 以 参照 品格 证 据 及 
习惯 证 据 的 可 采 性 规则 ,赋予 其 一 定 的 证 据 价值 ."?) 


二 、 对 传统 司法 证 明 标准 的 影响 


大 数据 侦查 思维 在 对 传统 证 明 方式 带 来 冲击 的 同时 ,也 会 对 司法 证 明 
标准 产生 影响 。 鉴 于 本 书 的 主题 是 "大 数据 侦查 ”, 这 里 主要 探讨 侦查 环节 
的 证 明 标 准 问题 。 美 国 证 据 法 将 证 明 标 准 分 为 绝对 确定 性 (absolute 
certainty) ,排除 合理 怀疑 (beyond reasonable doubt) 清晰 而 有 说 服 力 的 证 
明 (clear and convincing proof) ,合理 怀疑 (reasonable suspicion) 等 九 个 证 
明 标准 ,3) 不同 的 证 明 标 准 分 别 对 应 不 同 的 诉讼 阶段 。 侦 查 阶 段 的 证 明 标 
准 相 对 较 低 , 在 美国 ,采取 搜查 、 扣 押 上 \、 建 捕 等 侦查 措施 的 证 明 标 准 是 “合理 
根据 ?(probable cause) ,进行 拦截 和 拍 身 搜查 (stop and frisk) 的 证 明 标 准 
是 “合理 怀疑 ”(reasonable suspicion ) 。 

以 拦截 和 拍 身 搜查 (stop and frisk) 中 “合理 怀疑 "的 证 明 标 准 
(reasonable suspicion) 为 例 ." 在 传统 的 拦截 和 拍 身 搜查 程序 中 ,警方 需 
要 切实 观察 到 一 个 人 当下 的 行为 具有 犯罪 的 可 能 性 ,并 达到 合理 怀疑 的 程 
度 , 方 能 够 对 嫌疑 人 进行 拦截 以 及 拍 身 搜查 。 警 方 产 生 合理 怀疑 的 判断 必 


51] 何 家 弘 :《 从 应 然 到 实 然 一 -证 据 法 学 探究 ),247 一 251 页 ,北京 ,中 国法 制 出 版 社 ， 
2008 。 

52] 实际 上 ,衍生 数据 的 范围 要 远 远 广 于 传统 品格 证 据 、 习 惯 的 范畴 ,例如 有 些 衍生 证 据 是 
对 人 的 行为 轨迹 或 是 某 个 物体 状态 的 描述 ,与 品格 无 关 , 对 于 这 类 衍生 数据 应 该 可 以 作证 据 使 用 ; 
再 如 通过 数据 挖掘 所 得 出 的 犯罪 人 物 关 系 图 也 是 衍生 数据 的 一 种 ,但 是 其 所 证 明 的 是 犯罪 群体 中 
不 同 角色 的 功能 地 位 ,这 也 是 品格 证 据 及 习惯 证 据 的 范畴 都 无 法 堵 括 。 

[3] 陈 瑞 华 :《 刑 事 证据 法 学 》,247 页 ,北京 ,北京 大 学 出 版 社 ,2012。 

54] 拦截 和 拍 身 搜查 (stop and frisk) 中 的 “合理 怀疑 标准 "是 在 Terry v， Ohio 一 案 中 确立 
的 。 在 Terry 一 案 中 ,法 院 认为 警方 的 拦截 和 拍 身 搜查 (stop and frisk) 仍 然 属于 宪法 第 四 修正 案 
所 规定 的 扣押 和 搜查 (searches and seizures) ,但 是 由 于 情况 紧急 免除 了 “ 令 状 "的 要 求 ,不 过 仍然 应 
当 苛 以 "合理 根据 ”(probable cause) 的 证 明 标准 。 不 过 最 后 ,法 院 以 “合理 怀疑 ”的 标准 替代 了 “ 合 
理 根据 ”的 标准 ,降低 了 “拦截 和 拍 身 搜查 ”的 证 明 标准 要 求 。 
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须 是 根据 当时 的 事实 ,依据 其 执法 经 验 和 主观 判断 做 出 合理 推断 "1 然 
而 ,大 数据 预测 型 侦查 的 思维 方式 , 却 对 传统 的 合理 怀疑 标准 及 认定 方式 
产生 了 冲击 。 具 体 而 言 ,在 大 数据 时 代 , 从 技术 上 完全 可 以 获取 关于 犯罪 
嫌疑 人 的 大 量 个 人 数据 ,从 而 推测 其 犯罪 的 可 能 性 。 从 内 容 上 看 ,大 数据 
侦查 的 证 明 重 心 更 多 地 倾向 于 犯罪 人 本 身 而 不 是 当下 的 行为 ,更 多 地 倾向 
于 过 去 行为 的 历史 数据 而 非 当 前 行为 数据 ;从 形式 上 看 , 相 比 于 传统 合理 
怀疑 中 主观 型 、 经 验 型 的 认定 方式 而 言 ,大 数据 侦查 用 机 器 运算 得 出 数据 
来 表示 犯罪 概率 .犯罪 可 能 性 ,去 证 明 某 人 具有 多 大 的 可 能 性 实施 犯罪 。 
这 种 思维 的 问题 在 于 : 因为 犯罪 事实 尚未 实际 发 生 , 这 些 数据 并 非 直 接 来 
源 于 当下 的 行为 ,仅仅 通过 相关 数据 去 计算 一 个 人 犯罪 的 可 能 性 概率 ,这 
些 数据 是 否 能 够 构成 合理 怀疑 标准 呢 ?'?7 

然而 ,美国 在 Terry 案件 之 后 的 一 系列 司法 判例 中 ,合理 怀疑 ?标准 的 
内 涵 也 发 生 了 一 些 变化 ,似乎 为 大 数据 侦查 的 运用 提供 了 有 利 土 壤 。 
Terry v.，Ohio 案 中 强调 合理 怀疑 标准 要 建立 在 当前 的 犯罪 行为 上 ,而 不 能 
仅仅 依据 嫌疑 人 个 人 信息 来 判断 。 但 是 之 后 的 一 系列 判例 却 显示 出 ,合理 
怀疑 的 判断 内 容 越 来 越 倾向 于 与 嫌疑 人 有 关 的 个 人 信息 。 在 Sibron v. 
New York 案 中 (与 Terry 案件 在 同一 天 判决 ),53? 警 方 事前 并 不 认识 的 嫌 
疑 人 ,仅仅 根据 Sibron 与 几 名 吸毒 者 的 交谈 的 行为 便 怀疑 他 在 从 事 毒品 交 
易 ( 警 方 认识 吸毒 者 ) ,法 院 认 为 本 案 中 信息 不 充分 ,警方 缺少 与 嫌疑 人 身 
份 有 关 的 信息 便 做 出 了 合理 怀疑 ,因而 判决 警方 行为 不 合法 。 在 Alabama 
v. White 案件 中 ,和 警方 依据 一 份 匿名 举报 信 便 进行 了 搜查 和 逮捕 ,举报 
消息 包括 嫌疑 人 的 姓名 、 地 址 及 活动 路 线 , 法 院 认 为 此 案 构成 合理 怀疑 , 警 


C1] 王 兆 鹏 :《 美 国 刑事 诉讼 法 》,237 页 ,北京 ,北京 大 学 出 版 社 ,2005。 

[2] See Ferguson, Andrew Guthrie, “ Big Data and Predictive Reasonable Suspicion”, 
University of Pennsylvania Law Review,2 (2015) ,pp. 327-410. SeeKelly K. Koss,”" Leveraging 
Predictive Policing Algorithms to Restore Fourth Amendment Protections in High-Crime Areas in a 
Post-Wardlow World”, Chicago-Kent Law Review,1(2015) ,pp. 301-334. 

[3] 392 U.S. 40(1968). 

[54] 496 U.S. 325(1990). 
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方 行为 合法 。 在 Ornelas v，United States 一 案 中 ,5 警方 对 一 辆 有 嫌疑 
的 车 辆 进行 检索 ,发 现 车 主 的 名 字 在 贩毒 者 的 名 录 中 ,在 此 基础 上 警方 又 
搜集 了 嫌疑 人 的 一 些 其 他 信息 ,最 终 对 其 做 出 了 拦截 措施 。 在 United 
States v。Hensley 一 案 中 ,2 警方 仅仅 根据 嫌疑 人 在 另 一 州 的 黑 名 单 上 
(wanted flyer), 3 就 认定 合理 怀疑 ,法 院 认 为 此 案 中 的 个 人 身份 信息 足够 
达到 合理 怀疑 标准 ,可 以 进行 拦截 。 可 见 , 在 Hensley 案件 之 后 ,合理 怀疑 
标准 的 认定 就 不 仅仅 局 限于 正在 进行 的 犯罪 活动 了 .5 从 上 述 的 判例 变 
迁 中 ,可 以 看 出 法 院 对 于 合理 怀疑 的 认定 标准 从 当下 的 犯罪 行为 逐渐 倾斜 
至 嫌疑 人 的 个 人 信息 ,这 一 转变 似乎 为 大 数据 侦查 提供 了 运用 土壤 一 一 因 
为 通过 大 数据 技术 可 以 轻而易举 地 获取 与 嫌疑 人 有 关 的 个 人 数据 。 总 而 
言 之 ,大 数据 侦查 在 美国 的 司法 体系 中 已 经 显示 出 对 证 明 标 准 的 影响 ,但 
是 到 底 会 对 侦查 实务 产生 多 大 的 冲击 ,以 及 如 何 去 回 应 这 些 影响 ,还 需要 
根据 未 来 大 数据 侦查 技术 的 发 展 以 及 美国 的 司法 实践 来 给 出 确切 的 
答案 。 

我 国 证 明 标准 的 划分 并 不 像 美国 证 据 法 体系 那样 细致 ,况且 在 侦查 阶 
段 并 没有 明确 的 法 定 证 明 标准 。 尽 管 (刑事 诉讼 法 ) 第 107 条 规定 了 立案 
标准 ,第 79 条 规定 了 逮捕 标准 ,但 是 对 于 搜查 .扣押 等 其 他 侵犯 公民 人 身 
权利 、 财 产权 利 的 侦查 措施 并 没有 规定 证 明 标 准 , 更 不 要 说 像 美 国 一 样 对 
拦截 盘问、 检查 等 措施 规定 证 明 标准 了 。 因 而 不 少 学 者 认为 我 国 审 前 程 
序 并 没有 建立 司法 证 明 机 制 .552 长 期 以 来 在 侦查 实务 中 ,侦查 人 员 对 于 侦 
查 阶段 的 证 明 标 准 认 定 主要 结合 立案 标准 ,特别 是 逮捕 .起诉 标 准 进行 内 
心 的 主观 经 验 判 断 。 那 么 , 随 着 大 数据 侦查 技术 的 推广 和 普及 ,我 国 未 来 
的 侦查 中 是 和 否 也 会 面临 与 美国 同样 的 证 明 标 准 问题 呢 ? 试想 , 若 建立 了 


[1] 517 U.S. 690(1996). 

[2] 496 U.S. 221,223(1985). 

53] The only data point for suspicion was Hensley’s identity. 

[4] See Ferguson, Andrew Guthrie, “ Big Data and Predictive Reasonable Suspicion ”, 
University of Pennsylvania Law Review,2( 2015) ,pp. 327-410. 

55] 陈 瑞 华 :《 刑 事 诉 讼 中 的 证 明 标准 ), 载 (苏州 大 学 学 报 》,2013(3)。 
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“大 数据 高 危 分 子 预测 系统 ”, 对 于 高 危 分 子 的 犯罪 概率 或 人 身 危险 性 , 系 
统 给 出 了 如 30% .70 多 等 不 同 数值 ,或 是 给 出 了 如 轻 度 危险 .中 度 危险 ,高 
度 危 险 等 不 同 程度 的 预警 信号 。 这 些 不 同 的 数值 或 等 级 ,证 明了 当事人 的 
“嫌疑 程度 “危险 程度 ”的 大 小 和 高 低 是 不 同 的 。 那 么 ,这 里 就 存在 着 大 数 
据 分 析 结 果 与 证 明 标 准 以 及 侦查 措施 相对 应 、 相 衔接 的 问题 ,不 同 数值 是 
否 应 当 应 对 不 同 的 证 明 标准 、 采 取 不 同 的 侦查 措施 呢 ? 如 何 去 回 应 大 数据 
思维 对 传统 司法 证 明 标 准 所 带 来 的 影响 ,是 否 需要 建立 适应 大 数据 侦查 模 
式 的 证 明 标 准 , 这 些 怒 怕 都 是 需要 我 们 去 考虑 的 问题 。 


第 四 节 本 章 结 论 


本 章 主 要 探讨 了 大 数据 侦查 的 思维 体系 ,澄清 了 大 数据 侦查 中 可 能 存 
在 的 思维 误区 ,分析 大 数据 侦查 的 思维 特征 可 能 对 传统 侦查 程序 .原理 所 
带 来 的 影响 。 

大 数据 侦查 具有 相关 性 、` 整 体 性 及 预测 性 三 大 思维 特征 。 中 相关 性 。 
相 比 于 建立 在 人 类 因果 关系 思维 基础 上 的 传统 侦查 而 言 ,大 数据 侦查 遵循 
的 是 机 器 主导 的 相关 性 思维 分 析 模 式 , 通 过 量化 两 个 数值 之 间 的 数理 关系 
去 发 现 更 多 的 线索 。 加 整体 性 。 传 统 的 侦查 建立 在 小 数据 时 代 , 所 获取 的 
线索 .证据 带 有 ”抽样 的 特征 ,而 大 数据 侦查 则 采取 一 种 整体 取证 .整体 还 
原 事实 的 思维 路 径 。 回 预测 性 。 传 统 的 侦查 大 多 是 被 动 的 .事后 侦查 模 
式 , 大 数据 侦查 则 能 够 发 挥 大 数据 的 预测 思维 ,事前 对 犯罪 作出 预测 ,从 而 
防 患 于 未 然 。 

大 数据 侦查 思维 固然 能 够 促进 传统 侦查 向 着 高 效 、 智 能 化 方向 变革 ， 
但 在 这 一 趋势 下 也 要 并 防 陷入 “ 唯 大 数据 论 ” 的 误区 ,认为 大 数据 无 所 不 
能 。 殊 不 知 ,大 数据 分 析 结 果 并 非 一 定 是 客观 、 准 确 的 ,数据 源 质量 、 数 据 
采集 偏差 都 会 影响 分 析 结 果 的 准确 性 ;大 数据 还 会 以 某 种 隐蔽 手段 实施 时 
视 , 偏 见 行为 ,侦查 中 大 数据 偏见 容易 对 部 分 地 区 、 人 群 产生 “有 罪 歧视 ”; 
大 数据 的 相关 性 思维 也 并 非 万 能 的 ,在 司法 领域 ,机 器 的 相关 性 思维 归根 
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到 底 不 能 替代 建立 在 人 类 主观 经 验 基 础 上 的 因果 思维 ;对 于 大 数据 预测 性 
思维 违背 无 罪 推定 原则 的 这 一 观点 ,也 值得 再 商 椎 。 

大 数据 侦查 的 思维 特征 不 可 避免 地 会 对 传统 司法 证 明 机 理 产生 影响 。 
首先 ,大 数据 的 相关 性 思维 对 传统 的 司法 证 明 原理 会 带 来 一 定 的 冲击 。 传 
统 司 法 证 明 中 的 相关 性 建立 在 人 类 因果 关系 思维 的 基础 之 上 ,而 大 数据 侦 
查 的 相关 性 则 是 建立 在 机 器 相关 性 思维 的 基础 上 ,二 者 如 何 对 接 与 协调 是 
难题 。 其 次 ,大 数据 的 相关 性 思维 对 传统 司法 证 明 标 准 的 判断 方式 .表达 
方式 也 产生 了 一 定 的 影响 ,大 数据 预测 侦查 将 犯罪 可 能 性 表达 为 一 种 数学 
上 的 概率 ,如 何 将 其 和 传统 证 明 标准 进行 对 接 是 难题 。 上 述 的 这 些 问题 ， 
有 些 已 经 在 实务 运用 中 有 所 凸显 ,有 些 是 笔者 根据 大 数据 侦查 的 思维 特征 
所 进行 的 合理 化 判断 。 未 来 随 着 大 数据 技术 在 侦查 领域 的 推广 和 普及 ,大 
数据 可 能 会 对 更 多 的 侦查 原理 、 司 法 程序 产生 影响 。 如 何 去 协 调 、 对 接 传 
统 侦查 思维 与 大 数据 侦查 思维 之 间 的 差异 ,在 现 有 法 律 框架 下 构建 起 适应 
大 数据 思维 的 侦查 体系 ,是 我 们 不 得 不 面 对 的 问题 。 

在 具体 的 侦查 实务 中 ,大 数据 侦查 的 思维 特征 会 进一步 草 延 和 放大 
化 ,催生 出 以 大 数据 为 中 心 的 新 的 侦查 模式 。 例 如 预测 性 思维 会 产生 针对 
未 来 犯罪 的 事前 侦查 模式 ,整体 性 思维 会 产生 针对 同类 案件 的 整体 分 析 模 
式 , 相 关 性 思维 会 推动 侦查 人 员 在 数据 空间 对 相关 关系 的 挖掘 等 ,详情 将 
在 下 一 章节 分 析 。 
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“模式 ”是 指 事物 的 标准 样式 。 模 式 归 纳 法 是 从 概括 和 抽象 的 视角 出 
发 ,对 事物 的 本 质 和 结构 进行 提炼 ,但 无 法 描述 出 事物 的 全 面 样 貌 ,“' 据 
此 ,侦查 模式 就 是 对 实务 中 侦查 现象 、 侦 查 方法 所 不 断 旦 现 的 特征 和 规律 
进行 提炼 和 归纳 。"* ”本 章 拟 结合 大 数据 的 技术 特征 和 大 数据 侦查 的 实务 
运用 ,对 大 数据 侦查 的 运用 模式 进行 归纳 。 

目前 ,学 界 对 于 传统 的 侦查 模式 已 经 有 了 丰富 的 研究 成 果 。 按 照 不 同 
的 标准 ,可 以 对 侦查 模式 进行 不 同 的 分 类 : 如 根据 诉讼 双方 在 程序 中 的 地 
位 和 角色 不 同 , 可 以 分 为 对 抗 式 侦查 模式 和 职权 式 侦查 模式 ; ?按照 侦查 
中 参与 人 员 的 不 同 , 可 以 分 为 单轨 制 侦查 和 双轨 制 侦查 模式 ;5 另外 ,还 可 
以 从 侦查 活动 本 身 出 发 ,将 侦查 模式 分 为 “ 案 一 人 “人 一 案 ”“ 案 一 案 ” 
“ 物 一 案 ” 等 侦查 模式 。 其 实 ,无 论 是 何 种 侦查 模式 的 分 类 ,都 是 研究 者 基 
于 不 同 的 角度 ,对 纷繁 复杂 侦查 活动 的 本 质 和 特征 进行 的 提炼 和 归纳 。" 5 

对 于 纷繁 复杂 的 大 数据 侦查 活动 ,同样 可 以 依照 不 同 的 标准 来 进行 模 
式 归纳 。 本 章 拟 从 侦查 对 象 、 侦 查 时 空 ,数据 形态 等 不 同 的 角度 ,将 大 数据 
侦查 归纳 为 个 案 分 析 模 式 和 整体 分 析 模 式 , 回 溯 型 侦查 模式 和 预测 型 侦查 
模式 ,原生 数据 模式 和 衍生 数据 模式 ,“ 人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ” 
模式 ,以 及 “ 案 一 数 一 人 ”模式 和 “人 一 数 一 案 ” 模 式 。 


51] 陈 瑞 华 :《 刑 事 审判 原理 》,298 页 ,北京 ,北京 大 学 出 版 社 ,1997。 

[52] 李 心 鉴 :《 刑 事 诉 讼 构造 论 ),3 页 ,北京 ,中 国政 法 大 学 出 版 社 ,1998。 

53] 万 毅 :《 转 折 与 定位 : 侦查 模式 与 中 国 侦查 程序 改革 》, 载 (现代 法 学 ),2003(2) 。 

54] 何 家 弘 :《 从 它 山 到 本 土 一 一 刑事 司法 考究 ),6 一 25 页 ,北京 ,中 国法 制 出 版 社 ,2008 。 
55] 杨 郁 娟 :《 侦 查 模 式 基本 问题 研究 ), 载 (吉林 公安 高 等 专科 学 校 学 报 》,2008(2)。 
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第 一 节 个 案 分 析 模 式 和 整体 分 析 模 式 


一 、 个 案 分 析 模 式 与 整体 分 析 模 式 的 区 分 标准 


个 案 侦破 一 直 是 侦查 工作 的 核心 。 在 具体 个 案 发 生 后 ,侦查 人 员 可 以 
通过 大 数据 方法 去 发 现 数据 空间 的 案件 情报 、 线 索 和 证 据 。 殊 不 知 , 在 已 
经 侦破 的 海量 历史 犯罪 案件 中 ,通过 大 数据 挖掘 方法 ,也 能 够 发 现 作 案 手 
段 . 案 发 地 点 、 人 员 分 布 等 方面 的 特征 规律 ,并 为 今后 同类 案件 的 侦破 、 预 
测 提供 情报 信息 。 因 此 ,按照 分 析 对 象 的 不 同 ,可 以 将 大 数据 侦查 分 为 个 
案 分 析 模 式 和 整体 分 析 模 式 。 个 案 分 析 模 式 针对 的 是 某 个 具体 案件 ,在 案 
件 发 生 后 通过 大 数据 方法 查找 ,收集 与 案件 相关 的 线索 和 证 据 ;整体 分 析 
模式 则 不 针对 某 个 具体 的 案件 ,而 是 按照 不 同 的 维度 对 大 量 历史 案件 整体 
进行 大 数据 分 析 , 从 中 挖掘 出 犯罪 活动 在 地 域 .时 间 .类 型 人群 .作案 手段 
等 方面 所 呈现 出 来 的 整体 规律 特征 ,为 今后 同类 案件 的 侦破 及 预测 提供 
有 利 情 报信 息 。 














二 、 个 案 分 析 模 式 与 整体 分 析 模式 的 比较 


(一 ) 个 案 分 析 模 式 与 整体 分 析 模 式 的 差异 

除了 针对 的 对 象 不 同 ,个 案 分 析 模 式 和 整体 分 析 模 式 在 实施 的 时 间 、 
实施 的 目的 方面 也 有 着 显著 差异 。 中 实施 的 时 间 不 同 。 个 案 分 析 模 式 大 
都 是 在 某 个 具体 案件 发 生 后 进行 ,包括 所 谓 的 初 查 阶段 和 侦查 阶段 。 这 时 
候 一 般 已 经 有 基本 的 犯罪 事实 信息 或 犯罪 嫌疑 人 信息 。 只 有 在 案件 实际 
发 生 后 ,方才 有 条 件 根据 已 知 的 人 或 案 的 信息 去 选择 合适 的 大 数据 侦查 方 
法 。 整 体 分 析 模 式 虽然 也 是 发 生 在 案 发 后 ,但 并 非 是 在 某 个 具体 案件 发 生 
之 后 的 情境 ,而 是 基于 更 宏观 的 历史 视角 ,对 过 去 发 生 的 犯罪 数据 进行 分 
析 。 名 实施 的 目的 不 同 。 个 案 分 析 模 式 的 目的 非常 明确 ,就 是 寻找 有 价值 
的 线索 和 证 据 , 协 助 个 案 侦破 ,因而 个 案 分 析 模 式 在 时 间 上 也 具有 一 定 的 
紧迫 性 。 整 体 分 析 模 式 的 目的 是 发 据 过 去 已 经 发 生 的 案件 在 地 点 、 时 间 、 
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人 和 群 、 作 案 手 段 等 方面 所 呈现 的 特征 和 规律 ,这 些 特 征 和 规律 可 以 作为 未 
来 同类 案件 侦破 的 情报 ,也 可 以 作为 采取 预防 、 减 少 此 类 犯罪 发 生 措施 的 
依据 ,在 时 间 上 并 非特 别 紧迫 。 

(二 ) 个 案 分 析 模 式 与 整体 分 析 模 式 的 联系 

个 案 分 析 模 式 和 整体 分 析 模 式 并 非 是 完全 对 立 的 两 种 大 数据 侦查 模 
式 , 它 们 之 间 也 有 相互 促进 、 相 互利 用 的 一 面 。 

一 方面 ,在 整体 分 析 模 式 中 ,对 历史 案件 进行 大 数据 分 析 所 获取 的 特 
征 和 规律 ,可 以 为 同类 、 同 地 区 或 者 同人 群 的 案件 侦破 提供 有 利 的 情报 信 
息 , 促 进 个 案 的 侦破 效率 。 例 如 ,通过 大 数据 分 析 显 示 , 冒 充 微 信 账 号 欺诈 
类 犯罪 中 ,80% 的 犯罪 分 子 来 自 广西 宾 阳 籍 ,并 以 家 族 形式 作案 。 据 此 , 青 
遇 到 类 似 微 信和 欺诈 案件 时 ,侦查 人 员 就 可 以 首先 在 广西 宾 阳 籍 中 排查 嫌疑 
人 。 再 如 ,大 数据 分 析 显 示 “ 技 术 性 开锁 入 室 的 盗窃 团伙 一 般 来 自 江 西 宜 
春 ”, 犯 罪 手段 “技术 性 开锁 人 室 的 盗窃 "与 罪犯 户籍 地 "江西 宜春 之 间 就 
有 着 关联 性 , 当 某 地 发 生 技术 性 开锁 人 室 的 盗窃 时 ,侦查 人 员 就 要 联想 到 
可 能 是 江西 籍 罪犯 所 为 。 这 样 就 缩小 了 侦查 范围 ,提高 了 摸排 工作 的 

另 一 方面 ,整体 分 析 模 式 也 需要 建立 在 大 量 已 侦破 个 案 的 基础 上 ， 
大 数据 侦查 的 个 案 分 析 模 式 有 助 于 破获 更 多 的 案件 ,为 整体 分 析 模 式 
提供 更 丰富 的 数据 资源 。 整 体 性 特征 和 规律 的 总 结 需 要 以 大 量 同类 个 
案 为 基础 ,个 案 的 数量 越 多 ,所 提炼 的 特征 和 规律 就 越 具 有 代表 性 和 普 
适 性 。 例 如 侦查 人 员 对 微 信 欺诈 类 案件 及 技术 性 开锁 人 室 盗窃 案件 中 
犯罪 嫌疑 人 地 域 特征 规律 的 总 结 , 正 是 建立 在 海量 已 经 侦破 的 同类 案 
件 基 础 之 上 。 


三 、 个 案 分 析 模 式 与 整体 分 析 模 式 的 区 分 意义 


将 大 数据 侦查 区 分 为 个 案 分 析 模 式 和 整体 分 析 模 式 , 有 利于 侦查 人 员 
全 面 获 取 犯 罪 情报 和 信息 ,尤其 是 要 注意 对 整体 分 析 模式 的 运用 。 在 以 往 
的 侦查 活动 中 ,侦查 人 员 往 往 只 注重 在 个 案 发 生 后 ,收集 、 分 析 个 案 中 的 情 


。86 。 


第 四 章 “” 大 数据 侦查 的 模式 


报信 息 , 而 忽略 对 案件 整体 规律 的 总 结 归纳 。 即 便 是 有 一 些 总 结 历史 案件 
规律 的 做 法 ,但 由 于 传统 分 析 方法 的 限制 ,大 都 是 凭借 主观 经 验 对 具有 明 
显 表层 关系 的 犯罪 要 素 进行 归纳 总 结 。 随 着 社会 转型 的 加 快 ,犯罪 活动 呈 
现 类 型 丰富 化 .手段 多 样 化 ,情节 复杂 化 等 特征 ,相关 犯罪 数据 呈 海 量 增 长 
趋势 , 仅 靠 人 为 主观 分 析 已 经 难以 驾驭 这 些 庞大 复杂 的 犯罪 数据 。 大 数据 
整体 分 析 模 式 无 疑 为 犯罪 规律 分 析 提 供 了 最 好 的 方法 ,将 犯罪 特征 转化 为 
数据 之 间 的 函数 关系 ,借助 数据 挖掘 技术 对 海量 的 犯罪 数据 进行 定量 分 
析 ,通过 数学 模型 来 发 现 犯罪 要 素 之 间 更 深层 次 的 联系 。 常 见 的 整体 分 析 
模式 有 :“ 身 份 一 犯罪 模式 ”, 是 指 犯 罪 分 子 的 年 龄 性别. 职 业 、` 学 历 . 籍 贯 
等 身份 因素 与 犯罪 之 间 的 关系 环境 一 犯罪 模式 ”, 是 指 案 发 周围 的 地 理 
环境 .自然 环境 .社会 环境 ,监管 环境 等 因素 与 犯罪 之 间 的 关系 必 犯 罪行 
为 一 犯罪 行为 模式 ”, 是 指 在 犯罪 过 程 中 ,犯罪 分 子 在 各 个 阶段 所 实施 的 犯 
罪行 为 之 间 的 关联 性 。 

另外 ,大 数据 侦查 的 整体 分 析 模 式 还 强调 盘活 沉睡 已 久 的 司法 数据 资 
源 。 实 际 上 ,公安 机 关 、 检 察 机 关 及 法 院 的 电子 化 办 案 系 统 中 都 存 有 海量 
的 历史 案件 数据 ,它们 恰恰 是 对 历史 案件 特征 、 规 律 进行 分 析 的 最 佳 第 一 
手数 据 资源 。 但 是 由 于 实务 中 这 种 整体 分 析 模 式 尚 不 受 重视 ,案件 在 被 侦 
破 之 后 就 没有 多 少 价 值 了 ,大 量 的 案件 数据 都 还 处 于 沉睡 状态 。 因 此 ,下 
一 步 的 大 数据 侦查 工作 中 ,司法 人 员 应 当 意 识 到 办 案 系 统 中 所 蕴藏 的 丰富 
“数据 矿藏 ”, 尽 快 盘活 沉睡 的 历史 案件 数据 资源 。 实 际 上 ,目前 已 经 有 一 
些 地 区 的 侦查 机 关 开 始 意识 到 并 开发 本 地 的 司法 数据 资源 ,7 对 本 地 区 海 
量 犯 罪 数据 进行 大 数据 分 析 , 发 掘 各 类 型 犯罪 活动 的 规律 。 某 市 检察 院 大 
数据 平台 中 心 的 “专项 分 析 功 能 ”, 曾 对 该 市 2012 年 至 2014 年 的 涉 购物 卡 
类 犯罪 进行 整体 分 析 , 选 取 该 市 三 级 检察 机 关 所 办 理 案件 中 所 有 涉及 购物 
卡 的 犯罪 数据 ,以 购物 卡 为 主线 串联 起 各 相关 案件 ,分 析 购 物 卡 类 犯罪 在 
地 域 .人 群 . 时 间 等 不 同 维度 呈现 出 的 特征 ,为 该 市 检察 机 关 今 后 查办 、 预 





51] 例如 “全 国 检察 统一 业务 应 用 系统 ”中 的 海量 办 案 数 据 。 
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防 购物 卡 类 犯罪 案件 提供 了 丰富 的 情报 信息 资源 。 


第 二 节 ”回溯 型 侦查 模式 和 预测 型 侦查 模式 


一 、 回 溯 型 侦查 模式 和 预测 型 侦查 模式 的 区 分 标准 


由 于 时 空 的 不 可 道 性 ,人 类 不 可 能 先知 先觉 。 传 统 的 侦查 活动 一 般 只 
能 在 犯罪 行为 发 生 后 进行 ,侦查 活动 距离 犯罪 活动 总 有 一 定 的 时 间 汪 后 
性 。 由 于 时 间 差 的 存在 ,给 案件 的 侦破 带 来 了 困难 ,侦查 人 员 只 能 通过 有 
限 的 证 据 去 还 原 发 生 在 过 去 的 事实 ,这 事实 也 便 如 镜花水月 一 般 有 具有 模糊 
性 ;5 由 于 时 间 差 的 存在 ,即使 最 后 对 犯罪 分 子 科 以 刑罚 ,也 无 法 挽回 人 类 
的 生命 .财产 等 权利 所 受 的 伤害 。 因 此 ,长 久 以 来 对 犯罪 活动 的 预测 就 一 
直 是 人 类 为 之 努力 的 目标 。 实 质 上 ,看 似 纷 繁复 杂 的 犯罪 活动 ,背后 也 有 
着 一 定 的 规律 ,一旦 掌握 了 犯罪 规律 ,预测 未 来 的 犯罪 活动 便 不 再 是 遥 不 
可 及 之 事 。 大 数据 技术 的 出 现 ,使 得 人 类 预知 未 来 世界 成 为 可 能 。 大 数据 
能 够 将 事物 .现象 的 规律 转化 为 数据 之 间 的 数理 关系 ,从 而 预测 未 来 。 目 
前 ,大 数据 的 预测 功能 在 商业 领域 .互联 网 领域 已 经 得 到 了 广泛 证 实 ,在 犯 
罪 侦查 领域 的 运用 也 开始 轩 露 头角 。 如 果 能 够 提前 预知 何 时 、 何 地 会 发 生 
犯罪 ,警方 就 可 以 提前 采取 预防 .制止 措施 ,将 犯罪 活动 扼杀 在 准备 阶段 ， 
从 而 避免 公民 的 生命 .财产 等 权利 遭受 侵害 。 

实际 上 预测 犯罪 并 非 完 全 是 大 数据 的 产物 。 早 在 前 信息 化 时 代 人 类 
就 意识 到 了 预测 犯罪 的 重要 性 ,不 过 早期 的 犯罪 预测 更 多 的 是 依靠 侦查 人 
员 的 主观 经 验 来 判断 。 现 代 意 义 上 的 预测 型 侦查 可 以 追溯 到 20 世纪 80 年 
代 , 美 国 纽 约 (New York City Transit Police Lieutenant) 警察 杰克 马 普 
(Jack Maple) 发 明了 犯罪 制图 方法 ,通过 这 种 方式 识别 出 犯罪 高 危 地 区 ,并 
作为 警力 资源 分 配 依据 。 随 着 信息 科学 技术 的 发 展 ,1994 年 美国 纽约 警方 
发 明了 COMPSTAT, 警方 第 一 次 利用 电子 地 图 去 描绘 犯罪 数据 。 


C51) 何 家 弘 :《 短 缺 证 据 与 模糊 事实 ), 序 言 第 1 页 ,北京 ,法 律 出 版 社 ,2012。 
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COMPSTAT 对 于 预防 和 减少 犯罪 具有 显著 效果 ,在 人 类 的 侦查 历史 上 具 
有 里 程 碑 式 的 意义 ,尽管 其 不 如 现代 大 数据 算法 的 智能 化 ,但 是 已 经 具备 
了 预测 型 大 数据 侦查 的 雏形 。 随 着 人 类 信息 科学 技术 的 发 展 ,预测 犯罪 逐 
渐 由 传统 的 主观 经 验 式 分 析 转 移 到 现代 的 科学 数据 化 分 析 , 并 出 现 了 越 来 
越 多 的 自动 化 .智能 化 大 数据 预测 犯罪 工具 。 

犯罪 活动 之 所 以 可 以 被 预测 ,除了 强大 的 数据 分 析 技 术 外 ,犯罪 活动 
本 身 所 具有 的 规律 性 也 是 预测 的 前 提 。 经 研究 证 实 , 犯 罪 分 子 往 往 倾向 于 
在 同一 时 间 同一 地 点 实施 相同 的 犯罪 行为 。 尤 其 是 财产 类 犯罪 具有 相当 
高 的 重复 性 ,一 旦 犯罪 分 子 在 某 个 地 方 得 手 了 ,他 们 就 会 一 而 再 、 再 而 三 光 
顾 此 地 .5 这 在 犯罪 学 中 被 称 之 为 “邻近 重复 模型 ” (the near repeat 
model) ,'?) 这 一 模型 认为 犯罪 活动 遵循 像 地 震中 余震 一 样 的 规律 ,一 些 特 
定 的 犯罪 会 在 特定 的 区 域 重复 发 生 ,抢劫 、 盗 穷 等 财产 性 犯罪 都 遵循 这 种 
模式 。 预 测 型 大 数据 侦查 模式 将 犯罪 理论 与 犯罪 数据 相 结 合 ,核心 就 在 于 
设计 出 反映 各 种 犯罪 活动 特征 、 规 律 的 大 数据 "算法 模型 ", 将 犯罪 活动 的 


[1] See Kelly K. Koss, “Leveraging Predictive Policing Algorithms to Restore Fourth 
Amendment Protections in High-Crime Areas in a Post-Wardlow World”, Chicago Kent Law 
Review ,1(2015),pp. 301-334. 

52] 实际 上 ,关于 预测 型 侦查 还 有 其 他 一 些 犯 罪 学 理论 的 支撑 。 例 如 Risk terrain modeling 
(地 理 风险 模型 ) ,这 一 模型 认为 犯罪 行为 较 少 受到 之 前 事件 的 影响 ,而 是 受到 各 种 动态 因素 的 影 
响 , 如 社会 因素 ,心理 因素 ,行为 因素 等 。RTM 的 原理 是 选 定 与 犯罪 有 关 的 地 理 特征 、 环 境 特 征 
等 ,如 酒吧 ,酒店 .脱衣 舞 俱乐部 等 地 理 特征 ,然后 将 目标 区 域 与 事先 选 定 的 地 理 特 征 进 行 匹配 ,在 
此 基础 上 预测 犯罪 的 发 生 。Routine activity theory( 日 常 活动 理论 ) 也 是 一 个 非常 有 名 的 理论 , 认 
为 犯罪 的 发 生 都 是 由 于 以 下 三 个 基本 因素 所 造成 潜在 的 罪犯 ,适合 的 目标 以 及 缺失 的 监管 , 当 
在 合适 的 时 间 、 空 间 中 同时 具备 这 三 项 因素 时 ,犯罪 就 会 发 生 。Crime pattern theory( 犯 罪 模 式 理 
论 ) 认 为 罪犯 具有 独特 的 认 知 空间 ,犯罪 的 活动 范围 一 般 限定 在 一 个 三 角 空间 家 、 工 作 及 娱乐 
场所 ,这 些 地 区 就 是 罪犯 的 认 知 空间 ,在 认 知 空间 和 存在 犯罪 机 会 的 区 域 发 生 交 叉 时 犯罪 活动 就 有 
可 能 发 生 。SeeFerguson, Andre Guthrie, * Predictive Policing and Reasonable Suspicion”, Emory 











Law Journal ,2(2012) ,pp. 259-326. ; Kelly K. Koss,“Leveraging Predictive Policing Algorithms to 
Restore Fourth Amendment Protections in High-Crime Areas in a Post-Wardlow World” ,Chicago- 
Kent Law Review,1(2015)., pp. 301-334; Myers, Laura; Parrish, Allen; Williams, Alexis, “Big 
Data and the Fourth Amendment: Reducing Overreliance on the Objectivity of Predictive Policing” , 


Federal Courts Law Reuiero ,2(2015) ,pp. 231-244. 
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规律 转化 为 数据 之 间 的 相关 关系 ,利用 数据 规律 对 未 来 犯罪 活动 进行 预 
测 ,打通 连接 过 去 和 未 来 的 数据 桥梁 。 

综 上 ,按照 时 间 序 列 标准 ,可 以 将 大 数据 侦查 分 为 回溯 型 侦查 模式 和 
预测 型 侦查 模式 。 回 溯 型 侦查 模式 是 针对 已 经 发 生 的 犯罪 行为 ,可 以 是 在 
某 个 具体 案件 的 侦破 中 运用 大 数据 方法 寻找 相关 的 线索 ,证 据 ,也 可 以 是 
对 大 量 历史 犯罪 数据 进行 整体 的 分 析 , 寻 找 犯 罪 活动 的 内 在 规律 。 预 测 型 
侦查 模式 则 着 眼 于 未 知 的 犯罪 活动 ,通过 大 数据 技术 预测 未 来 犯罪 活动 的 
发 生 , 以 及 发 现 某 些 正在 发 生 的 隐蔽 性 犯罪 的 线索 。 





二 、 回 漳 型 侦查 模式 和 预测 型 侦查 模式 的 比较 


(一 ) 回溯 型 侦查 模式 和 预测 型 侦查 模式 的 联系 

从 时 间 轴 来 看 ,大 数据 本 身 的 运用 遵循 着 “对 过 去 /现状 的 把 握 一 对 未 
来 的 预测 一 优化 措施 ”这 样 一 个 连贯 过 程 。 首 先 需 要 收集 过 去 的 相关 数据 
并 进行 分 析 , 从 中 挖掘 出 共有 的 模式 和 规律 ,并 将 这 些 模式 和 规律 运用 至 
对 未 来 情况 的 预测 中 。 在 这 一 过 程 中 ,大 数据 运用 究竟 要 实现 到 哪个 级 别 
是 没有 规定 的 ,这 取决 于 决策 者 的 需要 ,做 到 “对 过 去 /现状 的 把 握 ” 这 一 步 
也 是 可 以 的 ,做 到 “对 未 来 的 预测 ?这 一 步 也 是 可 以 的 。 7 

大 数据 侦查 同样 也 遵循 这 一 时 间 轴 过 程 。 回 溯 型 大 数据 侦查 模式 和 
预测 型 大 数据 侦查 模式 尽管 是 大 数据 运用 体系 中 的 不 同 阶段 和 级 别 ,但 它 
们 实质 上 是 一 脉 相 承 的 关系 ,不 能 完全 割裂 开 来 。 例 如 , 某 市 检察 院 大 数 
据 平 台中 的 “职务 犯罪 风险 防 控 系统 ”, 就 体现 了 回溯 型 侦查 模式 和 预测 型 
侦查 模式 之 间 的 关系 。 首 先 ,该 系统 通过 对 海量 历史 犯罪 数据 进行 类 案 分 
析 , 在 此 基础 上 制定 相关 犯罪 的 预警 规则 ,如 “银行 交易 超过 35 万 元 达到 
一 级 预警 “企业 开票 超过 20 万 元 达到 三 级 预警 ”等 规则 ,该 系统 职务 犯罪 
预警 规则 的 制定 便 体 现 了 回溯 型 大 数据 侦查 模式 ;之 后 ,该 系统 将 职务 犯 


C51) [日 ] 城 田 真琴 :《 大 数据 的 冲击 ), 周 自 恒 译 ,128 一 132 页 ,北京 ,人 民 邮 电 出 版 社 ,2013。 
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未 来 大 数据 方法 


现在 





大 数据 描述 ”大 数据 预测 ”优化 措施 
图 4-1 大 数据 运用 的 时 间 体系 


罪 预警 规则 放置 于 海量 的 实时 数据 中 ,但 凡 发 现 超过 预警 值 的 数据 ,系统 
便 会 自动 报警 ,这 些 数 据 的 背后 便 有 可 能 隐藏 着 职务 犯罪 的 风险 ,该 系统 
的 犯罪 预警 功能 便 体现 了 预测 型 大 数据 侦查 模式 。 由 此 可 见 ,回溯 型 侦查 
模式 是 预测 型 侦查 模式 的 基础 ,对 未 来 犯罪 活动 的 预测 必须 建立 在 对 过 去 
犯罪 规律 ,模式 挖掘 的 基础 上 ,再 通过 回溯 型 侦查 模式 中 所 获取 的 “数据 模 
型 "来 预测 未 来 犯罪 活动 的 发 生 情 况 。 

(二 ) 回溯 型 侦查 模式 和 预测 型 侦查 模式 的 差异 

尽管 回溯 型 侦查 模式 和 预测 型 侦查 模式 是 一 脉 相 承 的 关系 ,但 是 由 于 
两 者 所 处 的 时 间 维 度 不 同 , 还 是 有 很 大 差异 的 。@D 两 种 模式 适用 的 情境 不 
同 。 回 溯 型 侦查 模式 针对 的 是 已 经 发 生 的 案件 ,无 论 是 具体 个 案 还 是 案件 
整体 情况 ,所 面 对 的 都 是 已 经 实 实 在 在 发 生 过 的 行为 。 根 据 “* 万 物 皆 可 数 
据 化 "的 原理 ,凡是 已 经 发 生 的 犯罪 行为 ,必定 会 留 有 一 定 的 数据 痕迹 。 因 
而 相对 来 说 ,回溯 型 侦查 模式 所 获悉 的 案件 信息 较为 丰富 。 然 而 预测 型 侦 
查 模式 主要 针对 的 是 尚未 发 生 的 案件 ,或 者 是 正在 发 生 但 较为 隐藏 的 案 
件 。 未 知 的 时 空虚 无 绿 绢 ,人 们 无 法 获知 实 实在 在 的 信息 ,并 且 往 往 由 于 
事先 采取 了 预防 措施 阻止 了 案件 的 发 生 , 永 远 无 法 证 实 是 否 会 有 预测 的 犯 


。91 。 


大 数据 侦查 


罪 活动 发 生 。 总 而 言 之 ,回溯 型 侦查 模式 的 适用 情境 是 实 实在 在 的 已 经 发 
生 的 犯罪 行为 ,而 预测 型 侦查 模式 的 适用 情境 主要 是 虚拟 的 、 未 知 的 时 空 。 
@ 两 种 模式 适用 的 效果 不 同 。 由 于 回溯 型 侦查 模式 所 面 对 的 是 已 经 实 实 
在 在 发 生 的 犯罪 行为 ,具有 明确 的 .具体 的 适用 情境 ,一 般 通 过 大 数据 侦查 
方法 即 能 够 获得 客观 、 准 确 的 情报 .线索 及 证 据 。 而 预测 型 侦查 模式 一 般 
是 对 将 来 犯罪 活动 的 预测 ,由 于 未 知 时 空 的 虚无 强 吉 ,通过 大 数据 方法 也 
只 能 计算 出 犯罪 发 生 的 概率 ,无 法 得 出 精准 的 结果 ,甚至 有 判断 错误 的 情 
形 。 因 此 , 相 较 于 预测 型 侦查 模式 而 言 ,回溯 型 侦查 模式 中 的 分 析 结 果 要 
更 客观 .准确 57] @ 两 种 模式 的 适用 目的 不 同 。 回 溯 型 侦查 模式 所 针对 的 
是 已 经 发 生 的 案件 ,侦查 人 员 运 用 大 数据 方法 的 主要 目的 是 查 明 案件 事 
实 、 抓 获 犯罪 分 子 ,或 者 是 总 结案 件 规律 特征 。 而 预测 型 侦查 模式 所 针对 
的 是 未 来 尚未 发 生 或 者 是 正在 发 生 的 案件 ,目的 是 将 犯罪 活动 阻止 在 萌芽 
中 ,防止 犯罪 活动 的 发 生 及 扩大 化 ,保护 公民 的 生命 .健康 .财产 等 权利 免 
受 侵害 。@ 侦 查 人 员 在 两 种 模式 中 的 主观 能 动 性 不 同 。 回 溯 型 侦查 模式 
与 传统 的 犯罪 侦查 一 样 ,都 是 在 案件 发 生 后 才 采 取 侦 查 措施 。 尽 管 大 数据 
能 够 为 案件 侦破 提供 更 多 的 技术 支撑 ,但 是 侦查 人 员 仍 然 处 于 被 动 地 位 ， 
侦查 措施 受 犯罪 分 子 的 行为 所 牵制 ,只 能 在 犯罪 分 子 实施 犯罪 行为 之 后 采 
取 侦 查 措 施 。 而 预测 型 侦查 模式 中 ,侦查 人 员 则 有 力 地 占据 了 主导 地 位 ， 
在 犯罪 活动 尚未 发 生 及 扩大 化 之 前 就 已 经 获悉 并 采取 相关 的 措施 , 侦查 行 
为 先 于 犯罪 行为 。 因 而 能 够 有 效 地 震慑 犯罪 分 子 , 阻 止 犯罪 活动 的 发 生 。 
可 见 ,在 预测 型 侦查 模式 中 侦查 人 员 的 主观 能 动 性 能 够 得 到 更 充分 的 
发 挥 。 





三 、 回 济 型 侦查 模式 和 预测 型 侦查 模式 的 区 分 意义 


区 分 回溯 型 侦查 模式 与 预测 型 侦查 模式 ,有 利于 侦查 人 员 从 目的 的 角 


51] 这 里 仅 就 整体 情况 而 言 .当然 也 不 排除 在 回溯 型 侦查 模式 中 大 数据 出 错 的 可 能 。 
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度 更 全 面 地 认识 大 数据 侦查 的 外 延 ,将 侦查 活动 的 时 间 轴 向 前 延伸 。 由 于 
人 类 认 知 能 力 的 有 限 性 以 及 犯罪 时 空 的 不 可 逆转 性 ,一 直 以 来 侦查 人 员 都 
是 在 犯罪 行为 发 生 之 后 才 采 取 侦 查 措施 。 长 此 以 往 , 侦 查 人 员 似 乎 也 根深 
蒂 固 地 认为 ,所 谓 的 “侦查 ”只 能 在 犯罪 行为 发 生 后 进行 ,对 于 预测 型 侦查 
往往 持 忽 视 甚 至 是 怀疑 的 态度 。 但 是 若 从 刑事 诉讼 的 任务 角度 考虑 , 则 会 
发 现 这 一 观点 是 片面 的 。 刑 事 诉讼 的 任务 既 包 括 查 明 犯 罪 事实 ,也 包括 保 
护 无 境 公 民 的 人 身 、. 财 产 等 权利。 传统 的 回溯 型 侦查 中 ,侦查 人 员 固 然 能 
够 查 明 犯 罪 事实 ,捉拿 犯罪 分 子 归案 ,但 是 由 于 时 间 的 滞后 性 ,公民 的 人 
身 、 财 产 等 权利 已 经 遭受 了 损害 ,即便 是 对 犯罪 分 子 科 以 再 严厉 的 刑罚 ,也 
无 法 弥补 受害 者 所 受 的 伤害 。 而 在 预测 型 侦查 中 ,侦查 人 员 则 能 够 在 时 间 
上 ,行动 上 占据 主动 地 位 , 先 发 制 敌 ,在 犯罪 分 子 行动 之 前 便 采取 相关 措施 
阻止 犯罪 活动 的 发 生 。 从 源头 上 保障 了 公民 的 人 身 、 财 产 等 权利 免 受 侵 
害 , 保 障 了 社会 秩序 的 稳定 。 因 此 ,从 侦查 目的 刑事 诉讼 任务 的 角度 出 
发 ,侦查 人 员 要 认识 到 预测 型 侦查 活动 的 重要 价值 。 

在 认识 到 预测 型 大 数据 侦查 模式 的 重要 性 之 后 ,侦查 人 员 在 实务 中 还 
要 学 会 灵活 合理 运用 预测 型 侦查 模式 。 就 目前 的 预测 型 大 数据 侦查 模式 
的 实务 运用 而 言 , 可 以 是 对 某 个 地 区 犯罪 活动 的 预测 ,可 以 是 对 某 个 人 犯 
罪 概率 的 预测 ,还 可 以 是 对 某 些 隐蔽 犯罪 线索 的 识别 。 

(1) 对 某 个 地 区 犯罪 活动 的 预测 .5 犯罪 活动 往往 与 地 理 位 置 有 密 
切 关 系 , 犯 罪行 为 在 时 空 上 的 呈 不 均匀 分 布 ,大 量 的 犯罪 往往 仅 集 中 在 小 
部 分 地 区 ,呈现 出 “犯罪 热点 ”的 特征 。 例 如 有 美国 研究 者 发 现 ,西雅图 
50% 的 犯罪 都 集中 在 城市 4. 5% 的 街区 ,明尼苏达 50. 4% 的 犯罪 发 生 在 
3.3% 的 地 区 ,波士顿 66% 的 犯罪 发 生 在 8% 的 地 区 。 利 用 犯罪 活动 在 地 理 
位 置 上 所 呈现 的 历史 规律 ,可 以 对 该 地 区 未 来 的 犯罪 活动 进行 预测 。 在 美 
国 已 经 出 现 了 很 多 智能 化 软件 ,能 够 对 某 个 地 区 的 犯罪 活动 进行 预测 ,如 
著名 的 PredPol 软件 根据 犯罪 类 型 .犯罪 时 间 和 犯罪 地 点 这 三 个 维度 的 数 


51] 在 后 文 “犯罪 热点 分 析 ” 章 节 中 还 会 有 详细 介绍 。 
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据 , 结 合 特定 的 算法 就 可 以 预测 出 某 个 地 区 的 犯罪 情况 .3 圣 克 鲁 效 警方 
利用 预测 型 大 数据 侦查 方法 ,统计 、 分 析 该 地 区 过 去 5 年 的 犯罪 数据 ,将 犯 
罪 活动 的 预测 精确 至 500 英尺 内 ,在 城中 共 划 分 出 15 个 这 样 的 高 危 地 区 ， 
在 预测 及 预 i 2 

(2) 对 某 个 人 犯罪 概率 的 预测 。 这 一 模式 实际 上 就 是 对 高 危 犯罪 人 员 

进行 预测 ,其 原理 与 高 危 地 区 犯罪 预 a 大 部 分 的 犯罪 往 
往 也 是 由 小 部 分 犯罪 分 子 实施 的 。 相 比 于 普通 人 而 言 ,这 些 高 危 分 子 在 人 
身 属性 方面 往往 呈现 出 固定 的 模式 ,在 户籍 、 年 龄 ,作案 手段 ,行动 轨迹 、 历 
史 犯 罪 数 据 等 方面 都 表现 出 一 定 的 特征 。 这 些 特征 与 高 危 人 员 的 认定 之 
间 存 在 着 直接 或 间接 的 联系 ,符合 一 定 特 征 模 式 的 人 员 很 可 能 就 是 犯罪 分 
子 。 根 据 此 原理 ,目前 我 国 已 经 有 不 少 侦查 部 门 开 始 研 发 高 危 分 子 的 大 数 
据 预 测 系统 。 如 某 市 公安 局 的 "刑事 专业 研判 平台 ”就 具有 高 危 人 员 预 警 
的 功能 ,其 针对 的 人 群 主要 是 在 该 市 辖区 活动 的 .具有 犯罪 前 科 并 具有 流 
窜 作案 特征 的 人 群 ,数据 主要 来 源 于 前 科 犯 罪人 员 数 据 库 、 旅 馆 住宿 数据 
库 、 网 吧 上 网 数据 库 以 及 相关 的 社会 行业 数据 库 。 不 过 目前 该 技术 尚未 完 
全 成 熟 , 据 相关 人 员 反 映 ,该 系统 最 大 的 难点 就 在 于 对 犯罪 高 危 人 群 特征 
的 算法 模型 设计 上 ,将 哪些 行为 特征 转化 成 算法 参数 以 及 如 何 对 不 同行 为 
特征 进行 权重 分 配 都 是 尚未 解决 的 难题 。 

(3) 对 某 些 犯罪 线索 的 识别 。 犯 罪 线 索 的 识别 一 般 可 以 通过 大 数据 的 
异常 数据 挖掘 功能 实现 。 在 对 数据 规律 进行 挖掘 的 时 候 ,经 常会 出 现 一 
不 同 于 一 般 模型 或 分 布 模式 的 “异常 数据 ”outliner) ,不 加 注意 的 话 这 些 异 
常 点 往往 被 作为 数据 噪音 而 被 忽略 或 处 理 。 然 而 ,这 些 “ 数 据 噪音 ”并非 就 


51] PredPol 是 美国 著名 的 犯罪 预测 工具 ,实务 中 运用 效果 良好 。 从 2013 年 1 月 到 2014 年 
1 月 ,洛杉矶 警察 局 称 犯罪 率 下 降 了 20% , 阿 罕 布 拉 警察 局 称 其 盗窃 犯罪 下 降 了 32% 、 机 动车 盗窃 
犯罪 下 降 了 20% , 诺 克 斯 警察 局 在 使 用 PredPol 工具 4 个 月 后 ,盗窃 和 抢劫 犯罪 就 下 降 了 15% 一 
30% 的 幅度 。 与 PredPol 功能 类 似 的 工具 还 有 孟菲斯 警方 使 用 的 Blue CRUSH, 纽 约 警方 使 用 的 
COMPSTAT, 以 及 IBM 开发 的 一 些 软 件 等 。 

[2] See Ferguson, Andre Guthrie, “Predictive Policing and Reasonable Suspicion”, Emory 
Larw Journal ,2(2012) ,pp. 259-326. 
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是 数据 垃圾 .数据 废气 ,它们 有 可 能 来 源 于 某 个 特殊 的 机 制 ,反而 是 事物 发 
展 状况 的 突变 或 外 来 入侵 的 讯号 , 正 所 谓 * 一 个 人 的 噪声 可 能 是 另 一 个 人 
的 信号 ”."1 犯罪 行为 往往 呈现 出 与 一 般 行 为 .现象 不 同 的 表现 形式 ,恰恰 
可 以 通过 大 数据 的 异常 数据 挖掘 功能 来 进行 识别 。 目 前 ,大 数据 的 犯罪 线 
索 识别 功能 已 经 在 很 多 领域 开始 发 挥 作用 ,典型 的 如 在 证 券 欺 诈 类 犯罪 中 
的 应 用 ,通过 对 用 户 行为 .交易 金额 ,交易 时 间 、 交 易 地 点 等 异常 值 的 识别 
来 发 现 隐蔽 的 欺诈 现象 。 根 据 证 监 会 的 统计 报告 , 自 2013 年 下 半年 开发 
启用 大 数据 监测 系统 以 来 ,截至 2015 年 初 , 已 经 捕获 内 幕 交易 线索 近 400 
起 ,其 中 近 40% 的 案件 已 经 移交 至 司法 程序 。"?) 


第 三 节 原生 数据 模式 和 衍生 数据 模式 


一 、 原生 数据 模式 和 衍生 数据 模式 的 区 分 标准 


在 大 数据 侦查 中 ,无 论 采 取 何 种 技术 方法 ,都 需要 以 数据 为 载体 ,都 离 
不 开 对 数据 的 分 析 。 从 数据 的 本 身 形态 出 发 ,可 以 将 其 分 为 原生 数据 和 衍 
生 数 据 , 原 生 数据 是 系统 第 一 次 产生 的 数据 ,保持 了 数据 的 原始 样 态 ; 衍 生 
数据 是 对 原生 数据 进行 加 工 、 分 析 后 所 产生 的 新 的 数据 形态 ."3? 在 大 数据 
侦查 中 ,以 所 获取 的 数据 形态 为 标准 ,可 以 分 为 原生 数据 模式 和 衍生 数据 
模式 两 种 类 型 。 原 生 数据 一 般 指 犯罪 过 程 中 所 留 下 的 数据 记录 ,如 监控 视 
频 中 记录 的 嫌疑 人 行踪 .手机 中 记录 的 嫌疑 人 通话 记录 、 银 行 卡 中 记录 的 
赃款 转移 .社交 软件 记录 的 聊天 内 容 、 旅 馆 住宿 登 记 数据 ,等 等 。 这 些 原生 
数据 往往 都 淹没 在 海量 的 日 常数 据 中 ,侦查 人 员 需 要 采取 数据 搜索 、 数 据 


C51) 朱 明 :《 数 据 挖掘 》,255 页 ,合肥 ,中 国 科 学 技术 大 学 出 版 社 ,2008。 

52] 证 监 会 官网 报告 : 《证监 会 通报 对 利用 未 公开 信息 交易 的 执法 工作 情况 》, 网 址 http:// 
www. csrc. gov. cn/ pub/newsite/zjhxwfb/xwdd/201412/t20141226_265701. html;《 证 监 会 通报 针 
对 内 幕 交 易 的 执法 工作 情况 ), 网址 http://www. csrc. gov. cn/pub/newsite/jcj/gzdt/201502/ 
t20150226_269077. html, 最 后 访问 时 间 : 2016 年 9 月 27 日 。 

53] 陈 小 江 :《 数 据 权 利 初探 ), 载 (法 制 日 报 ),2015 年 7 月 11 日 。 
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碰撞 、 数 据 查 询 等 方法 去 找到 与 案件 相关 的 那 一 小 部 分 原生 数据 。 这 一 过 
程 中 ,所 获取 的 这 部 分 数据 仍然 保持 了 其 产生 时 的 原始 状态 ,大 数据 仅仅 
是 一 种 技术 .手段 ,并 没有 改变 数据 的 原本 形态 ,因此 本 文 将 这 种 侦查 方式 
称 之 为 “原生 数据 模式 ”。 衍 生 数据 是 指 对 与 案件 .犯罪 嫌疑 人 相关 的 原始 
数据 进行 二 次 挖掘 、 分 析 后 所 得 出 的 数据 ,这 类 数据 往往 能 够 反映 案件 或 
嫌疑 人 的 某 些 深层 次 特征 。 例 如 通过 对 案件 中 嫌疑 人 的 通话 数据 进行 分 
析 , 能 够 获取 犯罪 分 子 网 络 关系 数据 ;对 嫌疑 人 的 手机 基站 数据 进行 分 析 ， 
能 够 获取 嫌疑 人 的 行动 轨迹 。 在 这 一 过 程 中 ,大 数据 技术 改变 了 数据 的 原 
始 形态 ,获取 的 是 建立 在 原本 海量 数据 基础 上 的 新 的 数据 ,本 文 将 其 称 之 
为 “衍生 数据 模式 ”。 需 要 注意 的 是 ,在 这 两 种 模式 中 ,侦查 人 员 所 采取 的 
都 是 大 数据 技术 方法 ,但 是 在 所 获取 的 数据 形态 上 有 差异 。 


二 、 原 生 数 据 模式 和 衍生 数据 模式 的 比较 


(一 ) 原生 数据 模式 和 衍生 数据 模式 的 差异 

两 者 所 适用 的 对 象 不 同 。 原 生 数 据 模式 一 般 在 个 案 侦查 中 运用 ,侦查 
人 员 为 了 侦破 案件 ,需要 在 数据 空间 去 寻找 与 案件 相关 的 线索 证据, 这 些 
数据 产生 于 原本 案件 发 生 的 时 空中 ,侦查 人 员 只 需 找到 它们 即 可 。 衍 生 数 
据 模 式 运用 范围 要 广 一 些 , 既 适用 于 个 案 的 侦破 ,如 获取 有 关 嫌 疑 人 行为 
特征 的 数据 .社交 关系 数据 ,行动 轨迹 数据 等 ;也 广泛 运用 于 对 历史 案件 的 
整体 分 析 ,分析 同类 案件 在 地 区 、 人 群 `. 行 为 方式 等 方面 所 呈现 出 的 特征 。 

两 者 所 采用 的 方法 不 同 。 原 生 数 据 模式 的 目的 是 在 数据 海洋 中 寻找 
到 与 案件 有 关 的 那 一 小 部 分 数据 ,所 遵循 的 是 “ 找 数据 ”的 逻辑 ,所 采取 的 
方法 一 般 有 数据 查询 数据 搜索 ,数据 碰 接 这 几 种 。 虽然 这 些 方 式 与 传统 
电子 取证 具有 相似 之 处 ,但 大 数据 为 电子 取证 源源 不 断 地 注入 了 新 的 技 
术 , 如 美国 民事 诉讼 中 所 运用 的 predictive coding 技术 ,就 是 大 数据 智能 分 
析 技 术 在 电子 取证 中 的 运用 。 衍 生 数 据 模式 的 目的 不 是 “ 找 数据 ”, 而 是 对 
数据 进行 分 析 , 挖 掘 数据 背后 的 规律 ,所 遵循 的 是 “二 次 分 析 ” 逻 辑 。 所 采 
取 的 方法 主要 有 数据 挖掘 ,犯罪 网 络 分 析 数据 画像 等 较为 复杂 的 大 数据 
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分 析 技 术 。 

两 者 的 运用 方式 不 同 。 原 生 数 据 模式 所 获取 的 数据 来 源 于 原本 的 案 
件 情境 中 ,与 案件 或 嫌疑 人 有 着 直接 的 联系 ,一 般 可 以 直接 作为 线索 或 是 
证 据 使 用 。 衍 生 数 据 模 式 所 获取 的 数据 并 非 直 接 来 源 于 原本 的 案件 情境 
中 ,尽管 衍生 数据 也 与 案件 存在 着 一 定 的 关联 性 ,但 并 非 是 直接 关联 ,而 是 
一 种 若 有 若 无 的 间接 关联 性 ,一 般 只 用 作 线 索 或 情报 信息 。 

(二 ) 原生 数据 模式 和 衍生 数据 模式 的 联系 

原生 数据 模式 和 衍生 数据 模式 的 联系 主要 体现 在 数据 形态 上 。 原 生 
数据 和 衍生 数据 之 间 本 身 是 相辅相成 关系 。 原 生 数 据 是 衍生 数据 的 基础 
和 来 源 , 没 有 原生 数据 ,衍生 数据 就 失去 了 加 工 原料 ,无 异 于 无 本 之 木 . 无 
源 之 水 ;衍生 数据 是 原生 数据 价值 的 升华 ,没有 衍生 数据 ,原生 数据 的 精 散 
和 价值 无 法 得 到 彰显 。 原 生 数 据 和 衍生 数据 的 关系 充分 诠释 了 “整体 大 于 
部 分 之 和 ”的 定律 ,从 个 别 数据 到 整体 数据 带 来 的 信息 传递 的 质 的 改变 。 
仅仅 对 原生 数据 进行 解读 ,所 获取 的 信息 是 有 限 的 ,但 是 将 大 量 的 原生 数 
据 整 合 起 来 进行 分 析 、 碰 撞 , 则 能 够 获取 更 深层 次 的 信息 ,衍生 数据 恰恰 能 
够 体现 大 数据 之 精髓 。" 2 


三 、 原生 数据 模式 和 衍生 数据 模式 的 区 分 意义 


区 分 原生 数据 模式 和 衍生 数据 模式 ,有 利于 侦查 人 员 选 择 合适 的 大 数 
据 侦 查 方法 ,更 全 面 地 获取 有 关 信息 。 在 以 往 的 侦查 中 ,由 于 大 数据 技术 
尚未 出 现 、. 普 及 ,衍生 数据 模式 对 于 大 部 分 侦查 人 员 还 较为 陌生 。 随 着 大 
数据 技术 的 发 展 和 成 熟 ,侦查 人 员 要 注重 对 案件 中 衍生 数据 的 利用 。 在 一 
般 的 个 案 侦破 中 , 侦查 人 员 可 以 同时 运用 这 两 种 侦查 模式 。 通 过 数据 搜 
索 、 数 据 碰撞 、 数 据 库 查询 等 方法 去 获取 原生 数据 ,最 大 范围 地 查找 与 案件 
直接 相关 的 数据 ,例如 能 够 证 明 部 分 案件 事实 的 聊天 数据 ,电子 邮件 数据 ， 
能 够 证 明 嫌疑 人 在 场 或 不 在 场 的 地 理 位 置 数据 ,等 等 。 通 过 数据 挖掘 、 犯 


C1) 苗 东 生 :《 从 科学 转型 演化 看 大 数据 》, 载 (首都 师范 大 学 学 报 》( 社 会 科学 版 ),2014(5) 。 
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罪 网 络 分 析 ,数据 画像 等 获取 衍生 数据 ,去 发 现 有 关 嫌 疑 人 行为 特征 .犯罪 
人 员 组 织 关系 ,资金 流向 等 信息 ,从 宏观 .整体 的 角度 对 案情 及 嫌疑 人 本 身 
进行 把 控 。 

例如 在 一 起 贪污 贿赂 案件 中 ,检察 人 员 接 到 举报 消息 称 某 区 财政 局 副 
局 长 华 某 涉嫌 受贿 贪污 贿赂 达 数 千 万 元 。 在 本 案 中 ,检察 人 员 同 时 运用 了 
原生 数据 和 衍生 数据 两 种 大 数据 侦查 模式 。 检 察 人 员 以 华 某 的 手机 数据 、 
话音 数据. 银行 数据 等 为 基础 ,通过 大 数据 平台 的 智能 挖掘 和 分 析 研 判 , 获 
取 了 有 关 华 某 性 格 特征 ,人 际 交往 关系 .资金 流转 等 方面 的 信息 。 这 些 信 
息 都 属于 衍生 数据 范畴 。 其 中 ,对 华 某 性 格 特征 的 分 析 有 利于 侦查 人 员 制 
定 讯问 策略 ,对 其 交往 关系 的 分 析 有 利于 筛选 出 可 疑 的 行贿 人 ,对 其 资金 
流转 的 分 析 有 利于 找到 赃款 的 去 向 。 与 此 同时 ,检察 人 员 还 对 华 某 的 短信 
进行 了 具体 分 析 , 通 过 关键 词 检索 筛选 出 一 些 可 能 与 案件 有 关 的 敏感 短 
信 。 例 如 ,发 现 深 圳 供电 局 短信 告知 其 用 电 度数 和 金额 , 华 某 曾 向 公安 朋 
友 咨 询 过 办 理 香港 移民 的 手续 等 敏感 短信 。 这 些 信息 都 属于 原生 数据 范 
畴 。 据 此 , 检 方 判断 , 华 某 在 深圳 可 能 有 房产 ,赃款 可 能 转移 至 香港 地 区 。 
在 这 起 案件 中 , 检 方 巧妙 地 运用 原生 数据 和 衍生 数据 两 种 模式 ,最 终 成 功 
破获 此 案 。 






























































-| 性 格 特征 制定 讯问 策略 
衍生 数据 模式 上 | 手机 数据 等 | 上 |。 交往 群体 上 | 第 选 行贿 人 
L | 资金 流向 迫 踪 赃款 去 向 
贪污 贿赂 案件 
站 | 深圳 供电 局 短信 房产 证 明 
原生 数据 模式 上 | 敏感 短信 | 
[| 咨询 香港 移民 短信 上 -| 赃款 可 疑 去 向 





























图 4-2 贪污 贿赂 案件 中 大 数据 侦查 之 衍生 数据 模式 
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第 四 节 “人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ”模式 


一 、“ 人 一 数 一 人 ”模式 和 *“ 案 一 数 一 案 ”模式 的 区 分 标准 


在 大 数据 时 代 , 一 切 皆 可 量化 ,数据 化 "是 大 数据 最 重要 的 特征 之 一 。 
现代 的 传 感 技 术 .识别 技术 已 经 使 “万 物 数据 化 ?成 为 可 能 ,人 类 的 书籍 文 
字 \ 行 为 踪迹 .地 理 位 置 等 都 能 以 数据 形式 呈现 ,甚至 连 心跳 情绪、 睡眠 、 
呼吸 都 可 以 被 数据 化 。 夸 张 一 点 说 ,物理 空间 的 一 切 都 可 以 在 虚拟 空间 找 
到 对 应 的 数据 痕迹 ,数据 世界 甚至 比 现实 世界 更 加 精彩 ,能 够 带 给 人 们 很 
多 现实 世界 反映 不 了 的 信息 。 大 数据 的 “数据 化 ”特征 也 为 犯罪 侦查 提供 
了 新 的 视角 ,侦查 人 员 可 以 在 数据 空间 寻找 嫌疑 人 或 案件 所 对 应 的 数据 痕 

从 数据 化 的 视角 出 发 ,可 以 将 大 数据 侦查 分 为 * 人 一 数 一 人 ”模式 和 
“ 案 一 数 一 案 "模式 。“ 人 一 数 一 人 ”模式 是 指 对 在 数据 空间 找到 与 现实 空 
间 对 应 的 数据 化 “嫌疑 人 ”, 前 一 个 “人 "是 指 存在 于 现实 空间 具体 化 、 形 象 
化 的 人 ;后 一 个 “人 ” 则 是 指 存在 于 虚拟 数据 空间 ,并 经 过 大 数据 分 析 后 所 
呈现 的 抽象 的 "人 ”。“ 案 一 数 一 案 ”模式 与 之 同 理 ,是 指 在 数据 空间 找到 与 
现实 空间 相对 应 的 数据 化 案件 信息 ,前 一 个 “ 案 ” 是 现实 空间 实 实在 在 的 案 
件 , 而 后 一 个 “ 案 ” 则 是 经 过 抽象 分 析 后 的 数据 化 案件 。 在 两 种 模式 中 ,大 
数据 都 扮演 着 连接 现实 空间 和 数据 空间 的 桥梁 作用 。 


二 、“ 人 一 数 一 人 ”模式 和 *“ 案 一 数 一 案 ”模式 的 比较 


(一 )“ 人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ”模式 的 联系 

两 种 模式 都 遵循 着 从 具体 到 抽象 .从 现象 到 规律 的 过 程 。 在 “人 
数 一 人 ”和 “ 案 一 数 一 案 ”两 种 模式 中 ,前 一 个 “人 ”和 “ 案 ” 都 是 指 具体 、 形 象 
的 嫌疑 人 或 案件 ,后 一 个 “人 ”和 “ 案 ” 则 是 对 于 嫌疑 人 或 案件 抽象 化 的 数据 
描述 。 无 论 是 嫌疑 人 还 是 犯罪 案件 ,在 现实 空间 都 是 以 具体 、 形 象 的 方式 
存在 的 ,所 呈现 出 的 信息 零散 而 有 限 。 而 在 数据 空间 ,嫌疑 人 及 犯罪 案件 


。99 。 


大 数据 侦查 


则 是 以 数据 的 形式 所 呈现 。“ 数 据 ? 能 够 为 侦查 人 员 整 合 . 分 析 案件 信息 提 
供 新 的 媒介 ,大 数据 方法 能 够 获取 更 全 面 的 有 关 人 、 案 的 信息 并 将 其 有 序 
整合 ,找到 数据 背后 的 深层 次 规律 ,将 嫌疑 人 和 案件 上 升 为 更 抽象 化 形态 。 

两 种 模式 中 ,大 数据 同时 扮演 了 媒介 角色 和 技术 角色 。“ 人 一 数 一 人 ” 
模式 和 “ 案 一 数 一 案 ”模式 可 以 分 解 为 两 个 阶段 ,分 别 是 “从 人 / 案 到 数 ” 阶 
段 和 “从 数 到 人 / 案 ” 阶 段 。 在 “从 人 / 案 到 数 ” 这 一 过 程 ,首先 就 是 要 找到 嫌 
疑 人 及 案件 在 数据 空间 的 相对 应 各 种 数据 ,这 需要 以 大 数据 作为 媒介 基 
础 。 在 这 一 过 程 中 ,大 数据 扮演 的 是 连接 现实 空间 和 数据 空间 的 媒介 。 在 
“从 数 到 人 / 案 ” 这 一 阶段 ,还 需要 进一步 运用 数据 挖掘 等 大 数据 方法 , 找 出 
纷繁 复杂 数据 背后 有 关 嫌 疑 人 或 案件 的 特征 、 规 律 等 重要 信息 。 在 这 一 过 
程 中 ,大 数据 扮演 的 则 是 找到 数据 背后 规律 的 分 析 技 术 、 方 法 。 例 如 在 一 
起 案件 侦查 中 ,侦查 人 员 想 对 嫌疑 人 A 展开 数据 化 分 析 , 侦查 人 员 首 先 需 
要 找到 有 关于 嫌疑 人 的 初始 化 、 未 经 分 析 的 “大 数据 ,这些 数据 可 以 来 自 
于 侦查 机 关 的 数据 库 ,也 可 以 来 自 于 嫌疑 人 的 手机 、 电 脑 、 通 话 记录 等 电子 
设备 中 。 收 集 数 据 便 完成 了 “人 一 数 ” 这 一 步 又。 在 此 基础 上 ,侦查 人 员 还 
需要 运用 数据 挖掘 等 技术 ,对 有 关 嫌 疑 人 A 的 海量 的 、 杂 乱 无 章 的 数据 进 
行 分 析 、 整 理 , 找 到 数据 背后 的 规律 ,如 有 关 其 人 际 关系 的 数据 ,行为 轨迹 
数据 、 兴 趣 爱 好 数据 、 性 格 特征 数据 等 ,将 嫌疑 人 A 上 升 为 抽象 的 数据 形 
象 。 分 析 数 据 则 完成 了 “ 数 一 人 ”这 一 步骤 。 





手机 数据 ， Ce 
人 际 关系 特征 ; 

电脑 数据 ， 人 际 关系 特 人 
| 入 为 轨迹 特征 ; 
玫 请 让 话 吝 数据， 一 兴起 爱好 尾 征 ， 


银行 数据 ; 性 格 特征 ; 














图 4-3 大 数据 侦查 之 ”人 一 数 一 人 ”模式 


(二 )“ 人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ”模式 的 区 别 
两 者 适用 的 对 象 不 同 。“ 人 一 数 一 人 ”模式 主要 以 犯罪 嫌疑 人 为 对 象 ， 
而 “ 案 一 数 一 案 ”模式 则 以 案件 整体 为 对 象 ,对 象 不 同 直接 决定 了 两 种 模式 
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中 数据 来 源 及 数据 分 析 的 维度 不 同 。“ 人 一 数 一 人 ”模式 是 以 人 为 对 象 , 主 
要 是 对 犯罪 分 子 展开 数据 化 分 析 , 因 而 所 选取 的 数据 大 都 是 带 有 个 人 特征 
的 信息 ,如 基本 人 口 数据 库 、 嫌 疑 人 的 话 单数 据 、 嫌 疑 人 的 手机 数据 等 。 对 
“人 ”的 分 析 维 度 一 般 既 包括 基本 身份 信息 ,如 家 庭 \ 性 别 , 年 龄 ,学 历 、 籍 贯 
等 ;也 包括 犯罪 分 子 的 行为 特征 、 兴 趣 爱 好 、 社 交 关 系 等 深层 次 信息 。 
“ 案 一 数 一 案 ”模式 主要 以 案件 为 主体 展开 数据 化 分 析 , 所 选取 的 数据 可 以 
是 有 关于 案件 的 所 有 信息 。 对 “ 案 ” 的 分 析 维 度 包 括 案件 类 型 、 案 发 地 点 、 
案 发 时 间作 案 手段 ,受害 人 群 等。 不 同 案件 中 数据 维度 的 选择 往往 也 不 
同 ,具体 取决 于 实务 中 需求 。 需 要 注意 的 是 ,在 案 的 分 析 中 ,也 会 牵涉 一 些 
有 关 嫌 疑 人 的 数据 ,但 并 不 影响 以 案件 作为 分 析 的 主题 。 

两 者 适用 的 情境 不 同 。“ 人 一 数 一 人 ”模式 一 般 在 个 案情 境 中 运用 较 
多 ,在 个 案 中 通过 对 嫌疑 人 位 置 数据 通话 数据 社交 数 据 、 消 费 数据 等 个 
人 信息 的 收集 ,在 此 基础 上 进行 数据 分 析 , 对 嫌疑 人 实现 多 维度 、 立 体 化 的 
数据 画像 。“ 案 一 数 一 案 ”模式 一 般 在 整体 情境 中 运用 较 多 ,因为 每 个 案件 
都 是 千差万别 的 ,在 具体 的 个 案 中 很 难 体 现 出 案件 共有 的 特征 和 规律 。 唯 
有 将 个 案 置 于 同类 案件 中 ,通过 大 量 同 类 案件 的 比较 ,甄别 , 方 能 找 出 案件 
的 特征 和 规律 。 因 此 ,“ 案 一 数 一 案 ”模式 一 般 较 多 地 在 整体 的 同类 案件 中 
展开 运用 。 


三 “人 一 数 一 人 ”模式 和 "” 案 一 数 一 案 ”模式 的 区 分 意义 


从 本 质 上 来 说 ,“ 人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ”模式 的 区 分 是 从 大 
数据 的 “数据 化 ”特征 出 发 ,在 现实 物理 空间 之 外 开发 出 与 之 相 平行 的 虚拟 
数据 空间 。 这 两 种 模式 的 区 分 意 在 提示 侦查 实务 人 员 要 注重 对 数据 空间 
的 开发 和 利用 ,将 物理 空间 中 难以 呈现 、 理 解 的 信息 ,通过 数据 的 形式 表达 
出 来 ,从 而 为 案件 的 侦破 提供 更 多 的 情报 .线索 。 

“人 一 数 一 人 ”模式 和 "” 案 一 数 一 案 ?模式 的 区 分 ,还 有 助 于 侦查 人 员 正 
确认 识 它们 的 功能 。“ 人 一 数 一 人 ”模式 有 利于 为 个 案 侦查 提供 线索 、 情 
报 , 为 侦查 人 员 对 嫌疑 人 的 讯问 策略 提供 依据 。 例 如 某 市 中 小 企业 发 展 促 
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进 局 局 长 张 某 涉嫌 贪污 贿赂 犯罪 ,侦查 人 员 通 过 对 其 话 单数 据 分 析 , 发 现 
其 与 民营 企业 家 陈 某 、 王 某 通 话 频 繁 ;通过 对 其 地 理 位 置 数据 分 析 , 发 现 其 
经 常 出 入 某 高 档 商 场 ;通过 对 其 银行 卡 数 据 分 析 , 发 现 其 有 数 笔 境 外 消费 
记录 。 至 此 ,侦查 人 员 已 经 在 数据 空间 对 嫌疑 人 有 了 清晰 明确 的 画像 ,对 
有 关 嫌 疑 人 行为 特征 、 人 际 关系 数据 的 获取 ,为 案件 侦破 提供 了 重要 的 线 
索 , 为 侦查 人 员 拿 下 嫌疑 人 口供 提供 了 关键 突破 口 。 

“ 案 一 数 一 案 ”模式 能 够 为 犯罪 预测 提供 依据 。 上 文 提 到 预测 型 大 数据 
侦查 模式 的 核心 就 是 设计 出 能 够 反映 案件 特征 、 规 律 的 算法 模型 ,而 “ 案 
数 一 案 "模式 正 是 对 案件 特征 、 规 律 的 数据 化 表达 过 程 。 例 如 ,上 文 所 提 到 的 
泉州 市 丰 泽 区 检察 院 “ 智 慧 检查 大 数据 分 析 平 台 ” 中 对 职务 犯罪 预警 规则 制 
定 , 便 是 " 案 一 数 一 案 "模式 的 运用 。 除 此 之 外 , 近 些 年 来 我 国 不 时 发 生 丽 怖 
暴力 犯罪 事件 ,这 些 铠 怖 分 子 往往 从 新 疆 地 区 迁移 到 云南 、 广 西 ,再 进一步 迁 
入 内 地 。 一 般 来 说 这 些 恐 怖 分 子 会 使 用 网 络 , 只 要 其 上 网 就 会 留 下 地 理 位 置 
数据 。 如 果 整 合 所 有 的 恐怖 犯罪 案件 ,挖掘 出 一 般 忍 怖 犯罪 中 嫌疑 人 行踪 轨 
迹 的 数据 模式 ,在 虚拟 数据 空间 构建 出 此 类 犯罪 的 特征 规律 ,并 将 之 运用 于 
对 网 络 用 户 地 理 位 置 数据 的 实时 监控 ,侦查 人 员 则 能 够 从 实时 的 海量 网 络 数 
据 中 识别 出 符合 怒 怖 分 子 迁移 特征 的 行动 轨迹 ,从 而 发 现 矶 怖 犯罪 活动 的 线 
索 。 这 也 是 “ 案 一 数 一 案 "模式 在 犯罪 预测 中 的 运用 。 


第 五 节 “ 案 一 数 一 人 ”模式 和 “人 一 数 一 案 ”模式 


一 、“ 案 一 数 一 人 "模式 和 “人 一 数 一 案 ”模式 的 内 涵 


传统 侦查 中 有 “ 案 一 人 "和 “人 一 案 ” 两 种 模式 。 前 者 是 先 有 案 后 有 人 ， 
从 案件 出 发 找到 犯罪 嫌疑 人 ;后 者 是 先 有 人 后 有 案 , 对 犯罪 嫌疑 人 展开 全 
方位 调查 ,根据 嫌疑 人 的 情况 来 确定 其 犯罪 事实 ,和 1 这 两 种 模式 诞生 于 前 
信息 化 时 代 , 犯 罪 活动 尚 还 局 限于 现实 的 物理 空间 ,属于 小 数据 时 代 的 侦 


51] 彭 波 :《 信 息 化 视 域 下 我 国 侦查 模式 的 变革 与 完善 ), 载 (山东 警察 学 院 学 报 》,2014(3) 。 
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查 模式 。 因 而 这 两 种 侦查 模式 中 都 是 以 物理 空间 的 案件 要 素 , 如 时 间 、 地 
点 ,物体 、 情 节 等 为 中 介 , 来 搭建 起 案 和 人 之 间 桥 梁 关系 。 随 着 人 类 犯罪 种 
类 的 多 样 化 ,犯罪 技术 的 日 新 月 异 , 尤 其 是 随 着 网 络 犯 罪 的 扩大 趋势 ,传统 
的 “从 案 到 人 ”模式 和 “从 人 到 案 ” 模 式 显然 已 经 不 足以 应 对 现代 犯罪 侦查 
的 需求 ,显得 日 益 捉襟见肘 。 因 此 ,有 学 者 提出 了 全 新 的 针对 网 络 犯 罪 的 
“ 事 一 机 一 人 ”及 “人 一 机 一 事 ” 侦 查 模式 ,将 涉案 的 电子 设备 或 账号 作为 中 
介 , 连 接 起 案件 事实 和 犯罪 嫌疑 人 的 关系 。" 

本 书 在 上 述 思路 基础 上 ,进一步 提出 “ 案 一 数 一 人 ”和 “人 一 数 一 案 ”的 
模式 ,分 别 对 应 传统 的 从 案 到 人 ”模式 和 “从 人 到 案 " 模 式 。 相 比 于 传统 的 
侦查 模式 而 言 ,“ 案 一 数 一 人 ”和 “人 一 数 一 案 ”模式 的 最 大 特点 是 将 涉案 或 
涉 人 的 “数据 ”作为 中 介 , 连 接 起 案件 事实 和 犯罪 嫌疑 人 之 间 的 关系 。 

“ 案 一 数 一 人 ”模式 以 “ 案 ” 为 出 发 点 ,具体 可 以 分 为 两 个 阶段 : 一 是 “从 
案 到 数 ” 阶 段 。 案 发 后 侦查 人 员 根 据 案件 的 具体 情况 去 搜寻 虚拟 空间 所 对 
应 的 数据 ,在 数据 空间 找到 传统 的 “ 何 时 、 何 地 、 何 故 、 何 情 ” 等 要 素 相对 应 
的 数据 痕迹 。 二 是 “从 数 到 人 ”阶段 。 侦 查 人 员 从 前 一 阶段 所 收集 到 的 与 
案件 有 关 的 数据 中 ,捕捉 到 与 嫌疑 人 有 关 的 信息 ,可 以 是 身份 数据 .图 像 数 
据 ` 行 为 数据 等 一 切 能 够 指向 犯罪 嫌疑 人 的 数据 ,直到 最 终 锁 定 嫌疑 人 身 
份 。 当 然 ,这 两 个 阶段 也 有 着 明显 不 同 的 特征 。Q@*“ 从 案 到 数 ” 阶 段 是 从 现 
实 空间 转向 数据 空间 的 过 程 ,而 “从 数 到 人 ”阶段 则 是 从 数据 空间 转向 现实 
空间 的 过 程 ;@ 前 一 阶段 的 主要 任务 是 “获取 数据 ”, 即 找到 与 案件 相关 的 
所 有 数据 痕迹 ;后 一 阶段 的 任务 是 “分 析 数 据 ”, 通 过 对 前 阶段 所 收集 海量 
数据 的 分 析 , 找 到 与 嫌疑 人 相关 的 信息 ,并 最 终 确定 犯罪 嫌疑 人 的 身份 。 
@ 前 一 阶段 所 涉及 的 侦查 技术 比较 简单 ,侦查 人 员 可 以 参照 传统 电子 数据 
提取 的 方式 ,来 获取 与 案件 有 关 的 “大 数据 ”; 后 一 阶段 则 需要 运用 到 专业 
的 大 数据 分 析 方 法 ,如 数据 搜索 、 数 据 磁 撞 、 数 据 挖掘 等 技术 ,从 海量 的 数 
据 中 获取 与 犯罪 嫌疑 人 相关 的 数据 。 


51] 刘 品 新 :《 论 网 络 时 代 侦查 模式 的 转变 ), 载 (山东 警察 学 院 学 报 》,2006(1) 。 
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“人 一 数 一 案 "模式 强调 以 "人 "立案 ,其 同样 可 以 分 为 两 个 阶段 : 一 是 
“从 人 到 数 ” 阶 段 。 这 一 阶段 以 嫌疑 人 为 中 心 ,向 周围 成 立体 化 扩散 模式 ， 
获取 与 人 有 关 的 大 量 相关 数据 ,这 些 数 据 可 以 来 源 于 侦查 机 关 数 据 库 , 也 
可 以 是 与 嫌疑 人 有 关 的 社会 数据 库 或 其 电子 载体 中 的 数据 。 在 虚拟 空间 
中 形成 一 个 与 现实 空间 相对 应 的 “数据 人 ”。 二 是 “从 数 到 案 ” 阶 段 。 这 一 
阶段 侦查 人 员 根 据 已 经 获取 的 “数据 人 ”信息 ,结合 其 他 线索 、 信 息 来 查找 
与 案件 有 关 的 数据 ;或 者 是 通过 数据 挖掘 技术 ,将 一 些 案件 的 算法 模式 与 
嫌疑 人 的 相关 数据 进行 匹配 ,从 而 识别 案件 线索 。“ 人 一 数 一 案 ”模式 的 这 
两 个 阶段 同样 有 着 明显 不 同 的 特征 ,由 于 与 案 一 数 一 人 ”模式 两 个 阶段 的 
特征 相似 ,在 此 不 再 袭 述 。 

总 而 言 之 ,“ 案 一 数 一 人 ”和 “人 一 数 一 案 ”模式 的 核心 在 于 以 “数据 ”为 
中 介 , 连 接 起 现实 空间 与 数据 空间 两 大 场景 ,连接 起 “ 案 ” 与 *^ 人 "之 间 的 关 
系 。 这 两 种 模式 提示 侦查 人 员 ,在 案 发 后 可 以 在 数据 空间 这 一 新 的 领域 寻 
找 破案 信息 。 


二 、“ 案 一 数 一 人 ”模式 的 运用 


“ 案 一 数 一 人 ”模式 在 传统 犯罪 与 网 络 犯罪 中 皆 可 适用 。 随 着 数据 化 
的 普及 ,即便 是 传统 的 犯罪 也 必定 会 在 数据 空间 留 下 痕迹 。 例 如 ,在 传统 
犯罪 中 ,犯罪 分 子 不 可 避免 地 会 打 电 话 、 使 用 手机 上 网 .乘坐 交通 工具 ,但 
凡 其 使 用 这 些 带 有 信息 化 特征 的 工具 ,犯罪 行为 就 会 被 “数据 化 ”。 无 处 不 
在 的 监控 摄像 头 更 是 让 嫌疑 人 无 处 可 逃 。 大 数据 时 代 就 像 是 一 个 “大 监 
控 ? 社 会 ,所 谓 " 数 "网 恢 恢 , 朴 而 不 漏 。 因 此 ,侦查 人 员 要 打开 思路 ,尤其 是 
在 案件 侦查 遇 到 瓶颈 时 ,要 善于 从 数据 空间 中 寻找 线索 。 

以 2013 年 的 美国 波士顿 爆炸 案件 为 例 ,警方 对 这 一 起 传统 的 物理 空 
间 案 件 就 采取 了 典型 的 “ 案 一 数 一 人 ”大 数据 侦查 模式 。2013 年 4 月 15 日 
下 午 , 美 国 波士顿 的 一 场 马拉松 比赛 中 突 发 爆炸 案 , 死 伤 惨重 ,嫌疑 人 趁 混 
乱 迅速 逃离 现场 ,警方 的 任务 就 是 尽快 找到 犯罪 嫌疑 人 并 将 其 抓获 。 案 发 
后 警方 几乎 调 取 了 与 案 发 现场 有 关 的 所 有 “大 数据 ”, 收 集 了 近 10TB 的 数 
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据 量 , 包 括 案 发 现场 周围 所 有 的 监控 录像 ,附近 12 个 街区 居民 所 拍摄 的 有 
关照 片 .视频 ,社交 网 站 上 的 相关 图 片 .文字 及 视频 信息 。 通 过 大 数据 技术 
对 这 些 海 量 数据 的 分 析 ,警方 在 三 天 后 便 确 定 了 嫌疑 人 为 焦 哈 尔 ， 萨 纳 耶 
夫 , 并 在 次 日 将 其 抓获 ."1 从 侦查 方式 来 看 ,本 案 明显 可 以 划分 为 “从 案 到 


数 ” 和 “从 数 到 人 ”两 个 阶段 。 在 前 一 阶段 ,警方 以 案 发 地 点 、 时 间 为 坐标 ， 
来 全 面 收集 与 案件 有 关 的 数据 。 这 一 阶段 主要 以 案件 为 出 发 点 ,以 “ 找 数 


据 ” 为 主要 工作 。 在 后 一 阶段 ,警方 对 收集 到 的 海量 数据 展开 挖掘 分 析 , 从 
中 找 出 能 够 指向 嫌疑 人 的 有 关 数 据 , 并 最 终 锁 定 嫌疑 人 的 身份 ,这 一 阶段 
主要 以 “人 ”为 出 发 点 ,以 “分 析 数 据 ” 为 主要 工作 。 





爆炸 现场 一》 














图 4-4 大 数据 侦查 之 “ 案 一 数 一 人 "模式 


在 网 络 犯 罪 中 ,更 是 常见 “ 案 一 数 一 人 ”的 大 数据 侦查 模式 ,如 2005 年 
我 国 某 市 警方 办 理 的 一 起 网 络 色情 案件 便 是 运用 这 一 模式 的 典型 。 案 中 
的 色情 网 站 名 为 “情色 六 月 天 ”, 该 色情 网 站 规模 庞大 ,注册 会 员 达 二 十 多 
万 ,涉案 管理 人 员 等 级 森严 ,形成 严密 的 犯罪 组 织 。 为 了 逃避 侦查 ,该 网 站 
的 服务 器 设 在 美国 ,域名 也 时 常 变换 。 如 何 从 虚拟 的 网 站 中 找到 犯罪 分 
子 , 成 为 该 案 侦破 的 最 大 难点 。 警 方 为 了 获取 更 多 的 信息 ,以 注册 会 员 方 
式 打 入 网 站 内 部 ,收集 了 汇款 中 对 方 的 银行 账号 以 及 该 账户 的 资金 往来 信 
息 ,收集 了 网 站 各 版 主 的 .论坛 管理 人 的 网 名 .QQ 等 信息 ,收集 了 该 网 站 活 
跃 人 员 的 联系 方式 等 大 量 数据 。 通 过 QQ 号 、 网 名 、 银 行 账号 及 资金 流向 
的 分 析 ,警方 最 终 锁 定 该 网 站 的 主要 涉案 人 分 布 在 福建 省 南平 市 ,并 顺利 


[1] See Data for Boston investigation will be crowd sourced, 载 CNN 网 http://edition. 
cnn. com/2013/04/17/tech/boston-marathon-investigation/ ,最 后 访问 时 间 : 2016 年 9 月 29 日 。 
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将 其 抓获 “23 该 案 的 侦查 过 程 同样 可 以 分 为 “从 案 到 数 ”" 和 “从 数 到 人 ”两 个 
阶段 。 在 前 一 阶段 ,警方 从 该 色情 网 站 内 部 获取 了 大 量 有 关 犯 罪 嫌 疑 人 的 数 
据 ,如 QQ 号 ,网 名 \ 银 行 账号 等 信息 ,尽管 这 些 “ 网 络 身份 数据 ”还 不 能 直接 
查获 犯罪 嫌疑 人 的 真实 身份 信息 ,但 是 为 锁定 犯罪 嫌疑 人 提供 了 重要 基础 。 
在 后 一 阶段 ,警方 对 这 些 网 络 身份 数据 展开 进一步 分 析 , 将 其 对 应 至 现实 的 
物理 空间 ,并 以 之 为 线索 最 终 锁 定 主要 嫌疑 人 的 真实 身份 及 其 落脚 点 。 





0 
色情 网 站 | 一 银行 账号 犯罪 嫌疑 人 
邮箱 账号 ; 

IP 地 址 


























图 4-5 大 数据 侦查 之 “ 案 一 数 一 人 "模式 


三 、“ 人 一 数 一 案 ”模式 的 运用 


“人 一 数 一 案 "模式 是 对 传统 “由 人 到 案 ” 侦 查 模式 的 升级 版 ,在 职务 犯罪 
侦查 中 将 会 有 着 广泛 的 运用 前 景 。 在 传统 的 职务 犯罪 侦查 中 ,由 于 此 类 案件 
没有 明显 的 案 发 现场 ,犯罪 行为 非常 隐蔽 ,如 受贿 行为 一 般 只 有 行贿 人 和 受 
贿 人 知道 ,加 之 犯罪 分 子 的 反 侦查 手段 较 高 ,因此 实务 中 存在 着 大 量 职 务 犯 
罪 黑 数 。 即 便 检 察 机 关 有 了 线索 立案 之 后 ,一 般 也 是 以 口供 类 证 据 为 主 ,一 
旦 没有 其 他 证 据 相 印证 , 则 无 法 认定 案件 事实 。“ 人 一 数 一 案 ”的 大 数据 侦查 
模式 有 望 改变 传统 职务 犯罪 侦查 所 面临 的 难题 。 在 初步 掌握 嫌疑 人 身份 信 
息 后 ,侦查 人 员 可 以 对 "嫌疑 人 ”进行 数据 画像 ,以 "人 "为 坐标 来 全 面 获取 有 
关 其 身份 .资产 ,行为 轨迹 等 信息 ,很 多 线索 也 会 随 之 以 数据 形式 所 浮现 。 

如 我 国 某 市 检察 机 关 就 将 “人 一 数 一 案 ”的 大 数据 侦查 模式 运用 至 对 
贪污 贿赂 案件 的 侦查 中 。@ 从 “人 一 数 ” 阶 段 。 在 接 到 举报 线索 后 的 初 查 
阶段 ,侦查 人 员 会 调 取 与 嫌疑 人 相关 的 基础 信息 数据 、 手 机 数据 、 话 单数 
据 \ 银 行 卡 数据 、 资 产 数据 、 出 入 境 数 据 等 ,并 以 时 间 轴 为 序 将 这 些 所 有 数 


C51) 秦 玉 海 等 :《 网 络 犯罪 侦查 ),355 一 356 页 ,北京 ,清华 大 学 出 版 社 ,2014。 
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据 整 合 排 列 以 及 智能 分 析 研 判 ,进一步 获取 有 关 嫌 疑 人 的 家 庭 、 资 产 、 房 
产 、 人 际 关系 、 行 为 习惯 、 兴 趣 爱 好 等 信息 ,在 虚拟 空间 形成 “数据 人 ”形象 。 
加 从" 数 一 案 ” 阶 段 。 侦 查 人 员 对 虚拟 的 “数据 人 ”展开 进一步 分 析 , 从 中 判 
断 、 析 取 与 案件 有 关 的 信息 ,对 案件 的 范围 .涉案 人 员 等 基本 情况 进行 初步 
判断 。 另 外 ,还 要 注意 一 些 个 别 的 异常 数据 ,例如 在 大 额 消费 .转账 前 后 ， 
要 留意 嫌疑 人 的 通话 、 短 信 记 录 , 嫌 疑 人 与 银行 卡 消费 异地 分 离 的 现象 也 
要 引起 重视 ,这 些 异常 数据 可 能 也 会 涉及 贪污 贿赂 的 案件 事实 。 


第 六 节 本 章 结 论 


本 章 对 大 数据 侦查 的 运用 模式 进行 了 归纳 。 将 大 数据 侦查 实务 中 已 
经 成 熟 一 些 的 运用 方式 进行 提炼 和 升华 ,归纳 共有 的 特征 和 样式 ,并 基于 
不 同 的 标准 对 其 进行 不 同 的 模式 构建 。 

本 文 提出 了 个 案 分 析 模 式 和 整体 分 析 模 式 ,回溯 型 侦查 模式 和 预测 型 
侦查 模式 ,原生 数据 模式 和 衍生 数据 模式 ,“ 人 一 数 一 人 ”模式 和 “ 案 一 数 
案 ” 模 式 , 以 及 “ 案 一 数 一 人 ”和 “人 一 数 一 案 ”这 五 类 典型 的 大 数据 侦查 模 
式 。@ 基 于 分 析 对 象 的 不 同 , 可 以 将 大 数据 侦查 分 为 个 案 分 析 模 式 和 整体 
分 析 模 式 。 个 案 分 析 模 式 从 微观 视角 着 眼 于 个 案 的 侦破 ,整体 分 析 模式 则 
从 宏观 的 视角 对 海量 案件 进行 整体 分 析 。@@ 基 于 时 间 序 列 的 不 同 ,可 以 将 
大 数据 侦查 分 为 回溯 型 侦查 模式 和 预测 型 侦查 模式 。 回 溯 型 侦查 模式 是 
面向 过 去 的 犯罪 活动 ,而 预测 型 侦查 模式 则 是 面向 未 来 的 ,尚未 发 生 或 正 
在 发 生 的 犯罪 活动 。 四 基于 数据 形态 的 不 同 ,可 以 将 大 数据 侦查 分 为 原生 
数据 模式 和 衍生 数据 模式 。 原 生 数 据 模式 的 任务 是 “ 找 数据 ”, 通 过 大 数据 
方法 找到 与 案件 相关 的 数据 ,这 种 方式 不 会 改变 数据 的 原本 形态 ;衍生 数 
据 模 式 的 任务 是 “分 析 数 据 ”, 通 过 大 数据 方法 对 相关 数据 进行 分 析 、 挖 气 ， 
获取 的 是 新 的 数据 形态 。@ 基 于 大 数据 之 “数据 化 ”特征 ,可 以 将 大 数据 侦 
查分 为 * 人 一 数 一 人 ”模式 和 “ 案 一 数 一 案 ”模式 。 将 大 数据 侦查 理解 为 从 
现实 空间 具体 的 人 、 案 到 数据 空间 抽象 的 人 、 案 的 这 一 过 程 ,在 虚拟 数据 空 
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间 寻 找 相 关 信息 。@“ 案 一 数 一 人 ”模式 和 “人 一 数 一 案 ”模式 是 在 传统 的 
“从 案 到 人 ”和 “从 人 到 案 ” 模 式 的 基础 上 发 展 而 来 ,强调 以 数据 作为 物理 空 
间 和 虚拟 空间 的 桥梁 ,连接 起 案件 和 嫌疑 人 之 间 的 关系 。 

大 数据 侦查 尚 属于 新 兴 事 物 ,对 大 数据 侦查 模式 的 归纳 ,有 利于 侦查 
人 员 从 宏观 .抽象 的 角度 加 强 对 大 数据 侦查 的 认识 ,有 利于 侦查 人 员 在 实 
务 中 选择 合适 的 侦查 模式 .制定 侦查 策略 。 当 然 , 本 书 对 大 数据 侦查 模式 
的 归纳 也 是 基于 笔者 本 身 的 研究 旨 趣 和 视角 ,不 排除 从 其 他 角度 归纳 出 其 
他 的 大 数据 侦查 模式 。 另 外 , 随 着 大 数据 技术 的 进步 和 大 数据 侦查 实务 的 
发 展 , 在 未 来 也 必 将 不 断 产生 新 的 大 数据 侦查 模式 。 
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本 章 主要 从 实务 运用 和 技术 角度 出 发 ,介绍 目前 大 数据 侦查 一 些 常用 
的 典型 方法 ,包括 数据 搜索 .数据 碰撞 、 数 据 挖 掘 、 数 据 画 像 , 犯 罪 网 络 分 析 
以 及 大 数据 公司 调 取 数据 , 旨 在 为 实务 中 侦查 机 关 开展 大 数据 侦查 方法 打 
开 思 路 。 这 些 方法 在 技术 特征 上 各 不 相同 ,侦查 机 关 可 以 根据 案件 情况 及 
已 有 的 侦查 资源 选择 合适 方法 。 


第 一 节 数据 搜索 


在 大 数据 侦查 的 实务 运用 中 ,数据 搜索 是 比较 简单 的 方法 。 按 照 数 据 
来 源 的 不 同 ,数据 搜索 可 以 分 为 数据 库 数据 搜索 .互联 网 数据 搜索 和 电子 
数据 搜索 三 类 。 数 据 库 搜索 主要 依托 于 侦查 机 关 已 有 的 各 种 信息 数据 库 ， 
以 及 可 供 利用 的 各 种 社会 行业 数据 库 ; 互 联网 搜索 则 与 我 们 一 般 所 接触 的 
网 络 搜索 没有 差异 ,将 开放 的 海量 互联 网 数据 作为 侦查 资源 ;此 外 ,在 电子 
取证 过 程 中 ,侦查 人 员 对 于 所 获取 的 初始 海量 数据 ,也 需要 运用 搜索 技术 
筛选 出 有 用 信息 。 不 过 这 几 种 搜索 方法 的 侧重 点 也 不 尽 相同 : 数据 库 搜索 
是 在 封闭 的 环境 中 进行 库 内 搜索 ,互联 网 搜索 则 是 在 开放 的 网 络 环境 中 对 
所 有 网 站 信息 的 抓 取 ,而 电子 数据 搜索 则 是 对 已 获取 的 电子 数据 进一步 甄 
别 和 筛选 。 














一 、 数 据 库 搜 索 


数据 搜索 是 数据 库 技术 的 重要 组 成 部 分 ,数据 的 信息 价值 需要 通过 搜 
索 技 术 体现 出 来 。 无 论 是 侦查 机 关 自 有 数据 库 还 是 社会 数据 库 , 在 建 库 时 
都 会 根据 数据 库 本 身 的 内 容 建立 相应 的 查询 功能 以 及 站 内 搜索 功能 。 


大 数据 侦查 


目前 ,大 数据 侦查 中 常用 的 数据 库 主 要 有 以 下 几 种 : 公安 机 关 自 有 
数据 库 。 就 侦查 机 关 自 有 数据 库 而 言 ,目前 公安 机 关 的 数据 库 较 为 强大 ， 
如 全 国 基本 人 口 信息 数据 库 、 全 国 在 逃 人 员 数 据 库 、 全 国 失踪 人 口 数据 库 
等 ,这 些 数据 库 都 带 有 多 维度 查询 及 站 内 搜索 功能 。 如 公安 部 部 级 人 口 管 
理 系 统 提 供 姓名 的 查询 、 身 份 证 号 精确 查询 、 出 生日 期 查询 等 功能 ,如 全 国 
违法 犯罪 人 员 数 据 库 提供 姓名 、 户 籍 地 、 案 别 、 同 案犯 等 查询 功能 ,全 国 被 
抢 咨 机 动车 数据 库 提供 车 牌号 、 车 架 号 ,发 动机 号 立案 单位 等 查询 功 
能 ,"1  @ 检 察 机 关 自 有 数据 库 。 检 察 机 关 的 自 有 数据 库 相 对 有 限 , 但 近年 
来 ,不 少 检察 机 关 采 取 “ 借 库 ” 的 方式 ,获取 工商 \ 税 务 、 招 投标 .银行 等 部 门 
的 可 观 数据 ,用 于 职务 犯罪 侦查 。 加 社会 行业 数据 库 。 除 了 侦查 机 关 自 有 
数据 库 外 ,很 多 社会 行业 的 公开 数据 库 也 成 为 大 数据 侦查 的 重要 数据 来 
源 。 这 些 社 会 行业 数据 库 涉 及 企业 数据 .身份 信息 、 车 辆 数据 ,物品 数据 、 
物流 信息 ,发 票数 据 .金融 数据 等 各 个 领域 ) @ 政 府 数 据 统一 开放 平台 。 
近年 来 ,一 些 省 市 还 建立 了 政府 数据 统一 开放 平台 ,如 北京 市 政务 数据 资 
源 网 、. 浙 江 政务 服务 网 .无 锡 市 政府 数据 服务 网 等 ,它们 将 政府 公开 数据 汇 
集 到 统一 平台 ,也 是 大 数据 侦查 的 重要 数据 来 源 。@ 专 业 的 “数据 超市 ”。 
随 着 大 数据 的 发 展 ,网 络 上 出 现 了 一 些 专门 性 的 、 综 合 性 的 数据 平台 。 它 
们 将 各 个 领域 分 散 的 数据 进行 汇总 .整合 ,并 提供 相应 的 数据 分 析 、 挖 掘 功 
能 。 例 如 “聚合 数据 ”平台 能 够 提供 30 大 类 、100 多 种 以 上 的 数据 库 API 服 
务 ;“ 启 信 宝 ” 则 将 与 企业 有 关 的 数据 进行 汇总 ,并 提供 关联 企业 分 析 、 关 联 
族谱 分 析 等 功能 。 这 些 网 络 上 的 专业 “数据 超市 "具有 强大 的 数据 资源 及 
数据 分 析 功能 ,已 成 为 大 数据 侦查 中 必 不 可 少 的 工具 。 

数据 库 搜索 需要 注意 以 下 一 些 技巧 : 在 查询 搜索 时 ,根据 待 查询 数据 
来 确定 数据 库 范围 ,最 好 选择 具有 唯一 识别 性 的 条 件 进行 精准 查找 ,如 身 


51] 陈刚 ;《 信 息 化 侦查 教程 》,280 一 283 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2014。 

52] 例如 “全 国企 业 信用 信息 公示 系统 ”(http://gsxt. saic. gov. cn/) 可 以 查询 全 国 各 地 企业 
的 信息 情况 ,“ 中 国 互联 网 络 信息 中 心 ”(http://www. cnnic. net. cn/? COLLCC=3462143412&) 
可 以 查询 网 站 ,服务器 ,注册 域名 等 信息 ,例如 * 飞 常 准 ”(http://www. veryzhun. com/) 可 以 查询 并 
实时 跟踪 航班 信息 。 仅 笔者 统计 到 的 社会 行业 开放 数据 库 就 有 1 300 多 个 。 
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份 证 号 、 姓 名 、 机 动车 号 等 ;在 已 知 信息 有 限时 ,也 可 以 选择 一 些 模糊 性 语 
言 或 者 关键 词 进行 搜索 ,但 是 这 样 的 搜索 结果 可 能 并 不 完整 .准确 ,需要 进 
一 步 筛选 以 及 补充 搜索 ,例如 以 “ 张 伟 ” 这 一 姓名 为 关键 词 进行 搜索 ,可 能 
会 出 现 几 百 条 相关 信息 ,那么 就 需要 侦查 人 员 根 据 性别 、 年 龄 .地 域 .案件 
等 情况 来 进行 筛选 。 

除了 单个 数据 库 的 查询 搜索 之 外 , 近年 来 侦查 部 门 也 在 逐渐 打通 各 数 
据 库 之 间 的 壁垒 ,促进 大 数据 的 共享 ,开发 数据 的 综合 查询 功能 、 一 键 式 搜 
索 功 能 。 具 体 而 言 , 就 是 将 多 个 数据 库 整合 ,统一 应 用 界面 ,一 般 只 需 输入 
一 次 关键 词 就 能 够 将 多 个 数据 库 中 所 有 相关 的 信息 都 显示 出 来 ,达到 “一 
次 搜索 、 多 库 查 询 ” 的 效果 。 例 如 “全 国 公安 综合 查询 系统 ”, 就 实现 了 对 全 
国 违法 犯罪 人 员 信息 、 全 国 在 逃 人 员 信 息 、 全 国 被 抢 盗 汽车 信息 、 全 国人 境 
人 员 信 息 等 数据 库 的 关联 查询 。: 2 目前 ,不 少 地 区 侦查 机 关 也 根据 实务 工 
作 的 需求 ,将 多 个 关联 数据 库 并 联 ,搭建 本 地 的 数据 综合 应 用 平台 ,实现 一 
站 式 查询 功能 。 例 如 江苏 扬州 某 区 公安 机 关 将 常住 人 口 、 高 危 人 员 、 和 暂 住 
人 口 、 单 位 场所 等 数据 进行 对 接 , 建 立 统一 查询 、 应 用 平台 ,实现 了 对 人 口 
和 场所 的 综合 管理 。 

除了 人 工 手 动 查询 搜索 外 ,近年 来 数据 库 的 自动 查询 搜索 技术 也 有 了 
很 大 发 展 。 很 多 系统 能 够 将 目标 数据 与 关联 数据 库 进 行 实时 关联 比 对 查 
询 ,符合 条 件 的 会 自动 发 出 警报 。 如 公安 的 卡 口 系统 能 够 对 过 卡车 辆 信息 
进行 自动 采集 ,包括 车 牌号 .车 型 等 基本 特征 ,并 将 车 辆 相关 数据 实时 与 后 
台 的 关联 数据 库 ( 如 被 盗 抢 机 动车 数据 库 、 交 通 後 事 逃 逸 车 辆 数据 库 等 ) 进 
行 比 对 ,经 比 对 车 辆 若 涉 嫌 违 法 ,系统 则 会 自动 发 出 预警 信息 ,现场 执法 人 
员 会 对 车 辆 进行 拦截 调查 。 再 如 现在 一 线 民 警 中 广泛 使 用 的 “移动 警 务 
通 ”, 民 警 将 日 常 巡 逻 调 查 中 采集 的 数据 如 身份 证 号 、 车 牌号 等 实时 输入 随 
身 携带 的 警 务 通 , 便 能 够 与 后 台 的 公民 身份 信息 数据 库 、 在 逃 人 员 数 据 库 
等 多 种 数据 库 进行 实时 查询 比 对 ,对 于 人 员 、 车 辆 等 是 否 有 涉案 嫌疑 一 目 


C51) 陈刚 :《 信 息 化 侦查 教程 ),280 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2014。 
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了 然 。 另 外 ,数据 库 之 间 还 可 以 进行 整体 比 对 ,侦查 机 关 可 以 根据 各 数据 
库 之 间 的 联系 ,建立 数据 库 实 时 更 新 和 自动 比 对 的 功能 ,例如 某 省 公安 厅 
建立 了 刑事 犯罪 多 库 联 侦 系 统 , 将 现场 勘 验 、 接 警 数据 与 指纹 .DNA、 足 迹 
数据 接 和 人 公安 大 平台 ,进行 智能 比 对 、 发 布 结果 ,以 迅速 锁定 涉案 人 员 ; 再 
如 某 市 公安 机 关 建 立 了 “六 类 人 员 比 对 四 库 系 统 ”, 民 警 建立 并 实时 更 新 本 
地 区 旅馆 住宿 人 员 、 暂 住人 员 、 网 吧 上 网 人 员 、 现 场 盘查 人 员 、 本 地 驾驶 人 
和 公共 娱乐 场所 从 业 人 员 六 大 数据 库 , 并 将 这 六 大 数据 库 与 全 国 在 逃 人 员 
数据 库 、 违 法 犯罪 人 员 数 据 库 ,吸毒 贩毒 人 员 数 据 库 .本 市 查缉 人 员 数 据 库 
进行 实时 比 对 报警 ,以 实现 对 地 区 流动 人 口 的 安防 管理 。 


二 、 互联 网 搜索 


除了 专业 数据 库 的 搜索 外 ,包容 万 象 的 互联 网 数据 也 是 大 数据 侦查 的 
重要 资源 。 相 比 于 专业 的 数据 库 而 言 ,互联 网 信息 尽管 杂乱 无 章 , 但 往往 
能 够 查找 到 一 些 关 键 的 信息 ,互联 网 的 开放 性 也 令 其 使 用 起 来 更 加 方便 
快捷 。 

互联 网 数据 以 文本 、 图 像 、 视 频 、 音 频 等 非 结构 化 的 形式 分 布 在 各 个 网 
页 ,逐条 浏览 信息 是 不 可 能 的 ,需要 用 到 搜索 引擎 技术 (search engine)。 根 
据 用 户 的 查询 需求 ,搜索 引擎 能 够 自动 从 海量 互联 网 信息 中 找到 相关 网 页 
信息 ,并 根据 网 页 内 容 的 相关 度 进 行 排序 ,再 反馈 给 用 户 。"1? 在 大 数据 侦 
查 中 ,常见 的 做 法 是 将 与 案件 或 嫌疑 人 相关 的 关键 词 输入 互联 网 进行 搜 
索 ,并 根据 互联 网 反馈 信息 进行 多 次 搜索 分 析 。 输 入 的 检索 信息 越 多 , 搜 
索 结果 的 范围 就 越 精 准 。 通 过 基本 的 互联 网 搜索 ,一 般 可 以 了 解 某 个 人 的 
工作 、 生 活 等 基本 信息 ,如 果 能 够 顺 苹 摸 瓜 找 到 调查 对 象 的 手机 号 、 邮 箱 
号 .网络 账号 等 较为 私密 的 信息 则 更 好 ,这 对 于 案件 初期 了 解 犯 罪 嫌疑 人 
的 相关 信息 是 一 种 很 好 的 办 法 。 例 如 在 职务 犯罪 侦查 初 查 阶段 ,如 果 侦 查 
机 关 自 有 数据 库 不 足 , 为 了 避免 打 草 惊 蛇 , 就 可 以 在 互联 网 上 对 调查 对 象 





C51] 圳 津 生 等 :《 搜 索引 擎 的 原理 与 实践 ),1 一 8 页 ,北京 .北京 邮电 大 学 出 版 社 ,2008。 
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的 基本 情况 进行 摸底 。 不 过 需要 注意 的 是 ,互联 网 上 信息 虽 多 但 是 鱼 龙 混 
杂 , 不 少 信 息 都 是 不 实 的 或 者 过 时 的 ,因此 还 需 根据 具体 案件 情况 对 网 络 
信息 的 真实 性 进行 分 析 判 断 。 

网 络 数据 的 海量 性 令 目 标 数据 的 搜索 工作 无 异 于 大 海 捞 针 , 如 何 准 
确 、 全 面 地 从 海量 数据 中 找到 相关 信息 , 尚 需要 掌握 一 些 基 本 的 搜索 技巧 。 
搜索 引擎 的 选择 。 除 了 常见 的 百度 、 谷 歌 等 搜索 引擎 外 ,还 要 注意 一 些 
开放 的 社会 数据 库 中 蕴藏 着 大 量 有 价值 信息 ,特别 是 上 文 所 提 到 的 互联 网 
上 一 些 专门 的 “数据 超市 ”, 例 如 航班 数据 信息 查询 、 企 业 数据 查询 、 专 利 数 
据 查询 等 ,这 些 网 站 中 一 般 都 设 有 站 内 搜索 功能 ,同样 可 以 进行 数据 搜索 。 
加 搜索 功能 的 选择 。 在 使 用 搜索 引擎 过 程 中 ,要 注意 利用 搜索 网 站 的 各 种 
功能 ,一 般 各 搜索 网 站 都 设置 有 “高 级 搜索 ”功能 ,侦查 人 员 可 以 根据 查找 
对 象 的 具体 需要 ,利用 高 级 搜索 功能 限定 相关 条 件 , 以 减少 元 长 .无 用 数 
据 , 精 简 数 据 范 围 。 思 关键 词 的 设置 。 关 键 词 搜索 是 网 络 搜索 引擎 的 最 主 
要 方式 ,侦查 人 员 可 以 选择 与 案情 、 嫌 疑 人 、 被 害 人 等 有 关 的 信息 语词 输入 
网 络 进行 多 次 检索 。 在 关键 词 的 选择 上 ,要 与 待 查 信息 具有 相关 性 ,并 保 
证 关键 词 本 身 具有 一 定 的 可 识别 特征 ,不 能 过 于 泛 化 。 此 外 ,还 可 以 借助 
双 引 号 (*”) 以 保证 词语 的 完整 性 。@ 历 史 网 页 搜索 。 历 史 网 页 是 指 某 个 
网 页 在 过 去 某 个 时 间 曾 经 的 状态 ,在 日 后 数据 丢失 或 是 网 页 不 存在 时 , 历 
史 网 页 可 以 起 到 证 据 保全 的 作用 。 现 在 网 络 上 有 很 多 网 站 具有 查询 历史 
网 页 的 功能 ,例如 * 百 度 快 照 "* 可 以 对 其 收录 的 每 个 网 页 进行 备份 .5 

当 互 联网 搜索 无 法 获取 足够 侦查 信息 时 ,侦查 人 员 还 可 以 利用 网 络 平 
台 主 动 征集 案件 有 关 信 息 ,这 是 一 种 “主动 搜索 ”的 方式 。 如 很 多 公安 机 关 
利用 微 博 公 众 号 发 布 通缉 令 或 者 征集 与 案件 有 关 的 线索 ,从 广义 上 来 说 也 
是 一 种 网 络 搜索 的 方法 。 例 如 2011 年 12 月 1 日 湖北 武汉 的 爆炸 案 发 生 
后 ,警方 通过 微 博 向 公众 征集 线索 并 实时 公布 案情 进展 ,网 友 们 纷纷 通过 
微 博 平台 向 警方 反馈 相关 线索 ,通过 这 一 “主动 搜索 ”的 方式 ,警方 迅速 获 


C1] 我 们 一 般 在 百度 检索 网 页 时 ,每 条 检索 信息 会 在 末尾 附带 一 个 “百度 快照 "的 标签 ,点 开 
之 后 能 够 看 到 该 网 页 在 过 去 某 个 时 间 段 的 状态 。 
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悉 了 大 量 有 关 犯 罪 嫌疑 人 和 犯罪 现场 的 线索 情报 ,并 根据 网 友 提 供 的 线索 
在 某 医院 将 嫌疑 人 缉拿 归案 .7 


三 、 电 子 数据 搜索 


电子 取证 中 也 需要 运用 到 数据 搜索 技术 。 电 子 取证 是 指 对 于 电子 设 
备 、 网 络 环境 中 的 电子 数据 采取 恢复 、 提 取 等 手段 ,以 获取 与 案件 有 关 的 数 
据 信 息 。523 电子 取证 的 一 个 重要 环节 就 是 从 已 经 获取 的 海量 电子 数据 中 
查找 ,提取 与 案件 有 关 的 数据 。 侦 查 人 员 一 般 需 要 结合 案情 并 利用 关键 词 
检索 技术 来 查找 所 需 数据 ,常见 的 有 根据 嫌疑 人 、 相 关 人 姓名 进行 关键 词 
检索 ,根据 涉案 地 点 、 案 件 具 体 情况 等 进行 关键 词 检 索 。 

笔者 以 某 市 检察 机 关 办 理 的 一 起 分 布 式 拒绝 服务 案件 为 例 来 对 电子 
数据 搜索 进行 介绍 (Distributed Denial of Service, DDoS) .533 根据 案件 需 
要 ,侦查 人 员 的 目标 就 是 从 涉案 计算 机 中 找 出 与 犯罪 行为 相关 的 电子 数 
据 ,包括 服务 器 租用 的 相关 记录 、 远 程 桌面 连接 的 相关 记录 ,与 被 害 服务 器 
相关 的 信息 等 。 在 对 嫌疑 人 电脑 数据 进行 初步 提取 后 ,侦查 人 员 以 租用 服 
务 器 的 IP 代码 "103. 40. 100. XX” 为 关键 词 进行 检索 ,查找 到 租用 服务 器 
过 期 续费 信息 (实际 中 命中 关键 词 的 语句 会 以 黄色 高 亮 显示 ) 。 

以 被 害 服务 器 IP 代码 “IP 地 址 111. 206. 115. X X ”为 关键 词 ,查找 到 
与 被 害 服务 器 进行 数据 交换 的 记录 。 

以 上 这 起 DDoS 攻击 案件 便 是 电子 取证 中 数据 搜索 的 典型 运用 。 但 是 
在 具体 的 案件 中 由 于 案件 情况 的 复杂 性 、 多 变性 ,这 种 自然 语言 的 关键 词 
检索 技术 在 运用 中 会 遇 到 一 定 的 障碍 : 首先 ,在 海量 的 数据 中 仅 通过 各 种 
关键 词 进行 检索 难免 有 漏网 之 鱼 , 有 些 不 包含 关键 词 的 相关 数据 很 可 能 就 
被 忽略 掉 了 ;其 次 ,自然 语言 有 具有 模糊 性 和 不 确定 性 ,同一 事物 往往 有 很 多 


51] 《武汉 12. 1 爆炸 案 告破 新 浪 微 博 网 友 及 时 发 布 消息 ), 载 新 浪 网 http://hb. sina. com. 
cn/news/m/2011-12-16/27337. html,2016 年 9 月 25 日 访问 。 

52] 刘 品 新 :《 职 务 犯罪 侦查 信息 化 与 电子 取证 ), 载 (国家 检察 官学 院 学 报 》,2013(6) 。 

53] 本 案 中 的 犯罪 分 子 对 一 家 交易 网 站 的 服务 器 发 起 了 DDoS 攻击 ,并 向 被 害 网 站 敲诈 勒 
索 100 万 元 ,最 终 造 成 该 交易 网 站 瘫痪 并 倒闭 。 
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图 5-1 电子 数据 搜索 


种 意思 相近 的 表达 方式 ,例如 ,对 于 “电子 数据 ”一 词 , 还 有 “电子 证 据 “ 数 
据 电文 ?等 多 种 称呼 ,不 同人 的 用 语 习惯 也 不 一 致 ,这 就 导致 数据 搜索 中 难 
以 考虑 周全 ;最 后 ,在 有 些 案件 中 嫌疑 人 的 反 侦 查 意识 很 强 ,可 能 会 选择 特 
定 代号 语言 进行 交流 ,或 者 以 其 他 合法 形式 掩盖 非法 目的 ,这 都 给 数据 搜 
索 造成 一 定 困难 。 因 此 ,电子 数据 检索 功能 的 革新 是 未 来 电子 取证 的 重要 
发 展 方向 之 一 ,笔者 认为 可 以 将 大 数据 智能 检索 技术 吸收 至 传统 的 电子 数 
据 搜索 中 。 在 这 一 问题 上 ,美国 在 民事 领域 已 经 率先 做 出 了 尝试 。 在 美国 
以 往 的 民事 电子 证 据 开 示 中 (E-discovery), 面 对 海量 电子 数据 ,当事人 及 
代理 律师 不 得 不 花费 大 量 的 时 间 和 费用 在 数据 检索 上 。 因 而 大 数据 智能 
检索 技术 (predictive coding ,technology assisted review,computer-assisted 
review 等 称 法 ) 应 运 而 生 。 它 的 原理 如 下 : 律师 们 首先 对 一 些 样本 性 数据 
做 出 关联 性 分 析 的 训练 ,这 些 训练 的 指示 一 般 来 源 于 可 以 使 用 的 资源 \、 诉 
讼 双方 的 需求 及 案件 情况 等 因素 ;然后 系统 根据 训练 样本 去 自动 分 析 其 他 
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数据 ,直到 律师 们 对 电脑 的 评阅 结果 满意 为 止 .“' ”这 种 利用 大 数据 关联 分 
析 的 检索 方法 不 仅 大 大 解放 了 劳动 力 ,而 且 能 弥补 传统 检索 方法 的 缺陷 和 
不 足 。 


第 二 节 数据 碰撞 


一 、 数据 碰撞 的 原理 


2014 年 12 月 ,铁道 部 "12306 网 站 "大量 的 个 人 信息 遭 到 了 泄露 ,信息 
内 容 包括 邮箱 账号 .密码 、. 姓 名、 身份 证 .手机 号 等 , 据 统计 泄露 的 用 户 数 据 


[1] See Tingen, Jacob, “ Technologies That Must Not Be Named: Understanding and 
Implementing Advanced Search Technologies in E-Discovery” , Richmond Journal of Law & 
Technology ,1(2012) ,pp. 1-49. 
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不 少 于 131 653 条 。 据 调查 ,本 次 信息 泄露 事件 乃 黑客 所 为 ,他 们 采用 了 
“ 撞 库 ?攻击 方法 。 22 黑客 们 事先 通过 攻击 其 他 网 站 等 非法 途径 ,获取 大 量 
的 用 户 账 户 和 密码 数据 ,建立 账户 密码 数据 库 , 然 后 通过 此 数据 库 与 目标 
网 站 进行 撞击 ,因为 很 多 用 户 习 惯 于 在 不 同 网 站 使 用 同一 账号 和 密码 ,如 
此 一 来 就 会 在 黑客 的 撞 库 中 匹配 成 功 ,从 而 造成 个 人 信息 泄露 。 尽 管 “ 撞 
库 ” 频 频 被 黑客 作为 违法 犯罪 的 重要 手段 ,但 是 其 技术 本 身 是 中 立 的 ,“ 撞 
库 ” 在 侦查 中 同样 也 可 以 发 挥 价值 。 即 本 文 所 要 介绍 的 数据 磁 撞 技术 。 具 
体 而 言 , 就 是 通过 专门 的 计算 机 软件 对 两 个 或 两 个 以 上 的 数据 库 /数据 集 
进行 碰撞 比 对 ,并 对 由 此 产生 的 重合 数据 、 交 又 数 据 进 行 深度 分 析 。 

大 数据 侦查 中 ,数据 碰撞 一 般 遵循 以 下 步骤。 第 一 步 ,确定 查找 对 象 。 
数据 碰撞 是 为 了 解决 案件 侦破 中 的 某 个 问题 或 查找 线索 ,如 嫌疑 人 的 行为 
轨迹 、 身 份 信息 、 同 行人 员 的 查找 、 涉 案 物 品 的 确定 等 。 第 二 步 ,根据 查找 
对 象 确定 并 筛选 相关 数据 集 。 一 个 案件 中 涉及 的 数据 集 很 多 ,但 并 非 每 个 
数据 集 都 有 必要 作为 碰撞 的 对 象 ,而 是 根据 分 析 主 题 的 需要 确定 一 定时 空 
范围 的 相关 数据 集 。 例 如 根据 已 知 的 行为 人 运动 轨迹 ,就 可 以 沿途 重要 地 
点 为 坐标 调 取 手 机 基站 数据 。 第 三 步 ,对 选取 的 数据 集 之 间 进 行 碰 撞 比 
对 。 一 般 需 要 两 个 或 两 个 以 上 的 数据 集 , 进行 两 两 碰撞 或 多 个 数据 集 同时 
碰撞 ,匹配 出 的 交叉 数据 便 是 可 疑 目 标 数据 ,本 文 也 称 之 为 “节点 数据 ”, 它 
们 往往 能 够 说 明 数 据 之 间 的 关联 性 或 者 同一 性 。 第 四 步 ,根据 具体 案情 进 
一 步 对 节点 数据 进行 分 析 研 判 ,获取 更 多 的 线索 、 确 立 下 一 步 侦 查 方向 。 








确定 对 象 [一 一 | 筛选 数据 集 HF 数据 碰撞 上 一 研判 分 析 




















图 5-3 数据 碰撞 流程 


在 数据 碰撞 过 程 中 ,需要 注意 以 下 一 些 要 点 及 技巧 : 数据 碰撞 以 全 
面 的 “数据 化 ”为 基础 ,嫌疑 人 的 行为 轨迹、 身份 信息 等 数据 被 记录 存储 


51] 《12306 用 户 数据 泄露 超 10 万 条 或 由 撞 库 攻击 所 得 》, 载 腾讯 网 http://tech. qq. com/a/ 
20141225/052603. htm, 最 后 访问 时 间 : 2016 年 9 月 27 日 。 
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下 来 是 数据 碰撞 的 前 提 。 这 既 依 托 侦查 机 关 本 身 的 信息 化 建设 ,也 依赖 于 
全 社会 的 大 数据 、 物 联网 的 发 展 进程 。 思 用 以 碰撞 的 数据 集 与 数据 集 之 间 
必须 是 同类 数据 ,例如 两 个 同 是 车 牌号 的 数据 集 可 以 进行 碰撞 ,但 是 车 牌 
号 数据 集 与 姓名 数据 集 之 间 就 无 法 进行 磁 撞 。@ 用 以 碰撞 的 数据 往往 是 
带 有 识别 性 的 数据 符号 ,这 也 称 之 为 “标识 数据 ”, 如 身份 证 号 姓名、 手机 
号 .账号 .车 牌号 .手机 串 号 等 数字 ,这 些 数据 具有 唯一 性 特征 ,能 够 直接 指 
向 对 应 的 人 或 物 。 一 般 以 标识 数据 为 媒介 来 进行 碰撞 ,更 容易 快速 精确 
获取 目标 信息 。 例 如 在 逃 人 员 数 据 与 全 国 基本 人 口 信息 数据 库 碰 撞 可 以 
身份 证 号 为 标识 数据 ,基站 数据 库 之 间 的 碰撞 可 以 手机 号 为 标识 数据 。 
@ 数 据 磁 撞 中 ,在 所 知 案件 信 息 有 限 的 情况 下 ,需要 以 “时 空 数据 ”作为 限 
制 条 件 。 时 空 数据 是 描述 事件 行为 的 时 间 、 地 理 信息 的 数据 ,一 般 用 作 筛 
选 数据 集 的 依据 ,以 提高 数据 碰撞 的 准确 性 。 碰 撞 中 所 运用 的 时 空 数据 越 
多 ,碰撞 的 结果 就 越 精准 。 例 如 事先 知道 嫌疑 人 的 轨迹 , 想 找到 其 伴随 车 
辆 的 车 牌号 等 信息 ,这 时 便 可 以 调 取 嫌疑 人 行动 轨迹 上 的 各 卡 口 车 辆 数据 
进行 碰撞 ,如 果 不 进行 时 空 限制 , 调 取 每 个 卡 口 的 车 牌 数 据 库 进行 碰撞 ,很 
可 能 会 出 现 大 量 的 重合 数据 ,但 如 果 结 合 嫌疑 人 在 每 个 卡 口 的 时 空 数据 ， 
选取 每 个 卡 口 对 应 时 间 段 的 车 辆 数据 进行 碰撞 ,满足 条 件 的 车 牌号 就 会 大 
大 精 减 。 


二 、 数据 碰撞 的 示例 


下 面 以 一 起 简单 的 案例 来 说 明 数据 碰撞 在 侦查 中 是 如 何 运 用 的 : 2009 
年 某 地 出 现 多 起 电话 诈骗 案件 ,犯罪 分 子 冒 充 公安 机 关 谎 称 受害 者 卷 信 洗 
钱 和 毒品 案件 ,并 诱骗 受害 者 将 银行 资金 转 入 一 个 指定 的 陌生 账户 。 之 后 
犯罪 分 子 迅速 取款 ,完成 诈骗 活动 。 侦 查 人 员 通 过 收 款 账户 的 取款 信息 ， 
逐一 调 取 取 款 监控 视频 ,发 现 取款 人 为 同一 名 青年 男子 ,并 且 其 在 取款 时 
均 有 拨打 手机 的 行为 。 侦 查 人 员 以 此 为 出 发 点 , 调 取 了 每 次 取款 地 点 附近 
的 通信 基站 数据 ,并 根据 监控 视频 的 时 间 来 确定 该 男子 每 次 拨打 手机 的 起 
止 时 间 。 通 过 对 数 个 基站 数据 的 碰撞 , 侦查 人 员 最 终 锁 定 该 男子 的 手机 号 
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码 为 1596037X XX3。51) 我 们 以 此 案 为 例 来 分 析 警 方 是 如 何 运用 数据 碰 
撞 方 法 来 锁定 目标 嫌疑 人 身份 的 。 

(1) 确定 对 象 : 根据 监控 视频 中 嫌疑 人 拨打 手机 的 信息 ,确定 查找 的 
目标 是 嫌疑 人 的 手机 号 ; 

(2) 筛选 数据 集 : 根据 取款 地 点 筛选 附近 的 基站 数据 ,但 每 个 基站 数 
据 库 的 数据 都 是 海量 的 ,这 时 就 需要 根据 嫌疑 人 打 电 话 的 起 止 时 间 来 确定 
基站 数据 的 时 间 范 围 , 即 上 文 所 说 的 “时 空 数据 

(3) 数据 碰撞 : 在 确定 数据 集 之 后 ,选取 手机 号 作为 “标识 数据 ”来 进 
行 数据 库 碰撞 ; 

(4) 分 析 研 判 : 在 碰撞 得 出 的 交叉 数据 中 进一步 分 析 , 锁定 嫌疑 人 的 
手机 号 为 1596037X X X3, 并 反 查 出 嫌疑 人 身份 信息 。 


表 5-1 数据 碰撞 案例 














时 间 数 据 空间 数据 标识 数据 数据 集 
11 月 5 日 13:00~13:15 | 厦门 市 集美 区 A 地 手机 号 | 基站 A 数据 库 
11 月 25 日 20:15~20;19 | 厦门 市 同安 区 B 地 手机 号 | 基站 也 数据 库 
12 月 1 日 22:40 一 22: 43 | 厦门 市 翔 安 区 C 地 手机 号 | 基站 C 数据 库 











上 述 便 是 一 起 典型 的 数据 碰撞 侦查 实例 。 此 案 中 ,侦查 人 员 以 基站 数 
据 作为 碰撞 数据 集 ,选取 手机 号 作为 标识 数据 进行 碰撞 ,并 利用 时 空 数据 
进一步 缩小 碰撞 范围 ,最 终 成 功 锁定 嫌疑 人 的 手机 号 ,进而 确定 其 身份 。 
大 数据 侦查 实务 中 ,常见 的 作为 碰撞 载体 数据 库 包 括 侦查 机 关 数 据 库 和 社会 
各 行业 数据 库 , 如 犯罪 前 科 人 员 数 据 库 、 基 站 数据 库 、 网 吧 上 网 人 员 数 据 库 、 
卡 口 数据 库 、 被 抢 盗 物 品 数据 库 等 。 常 见 的 数据 碰撞 类 型 有 话 单数 据 碰撞 、 
轨迹 数据 碰撞 、 交 易 数据 碰撞 等 。 本 文 介 绍 以 下 几 种 常见 的 数据 碰撞 类 型 。 


51] 李 双 其 , 曹 文安 , 黄 云 峰 :《 法 治 视野 下 的 信息 化 侦查 》,163 页 ,北京 ,中 国 检察 出 版 社 ， 
2011。 本 文 对 案件 的 具体 信息 ,如 地 点 .时 间 进 行 了 一 些 修改 。 
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(1) 话 单 数据 碰撞 。 话 单数 据 一 般 包 括 联 系 人 数据 、 通 话 数据 短信 数 
据 、 基 站 数据 等 ,为 数据 碰撞 提供 了 丰富 的 数据 集 。 在 同一 案件 中 ,如 果 有 
多 位 涉案 嫌疑 人 或 相关 人 ,可 以 对 他 们 的 话 单数 据 进行 多 维度 的 碰撞 从 而 
找 出 更 多 线索 : 四 可 以 共同 联系 人 为 目标 ,对 各 嫌疑 人 通话 记录 中 的 联系 
人 进行 碰撞 ,共有 高 频 联系 人 很 可 能 也 在 案件 中 扮演 重要 角色 。@ 可 以 同 
一 时 空 为 目标 ,对 同 案 中 不 同 嫌疑 人 的 基站 位 置 数据 进行 碰撞 ,同一 时 间 
位 于 同一 地 点 的 ,说 明 他 们 之 间 有 过 碰面 :@ 可 以 同行 人 员 为 目标 进行 碰 
撞 。 对 于 有 同伙 结伴 作案 的 而 又 只 知道 其 中 一 人 手机 号 的 ,根据 其 通话 记 
录 中 的 各 基站 位 置 , 反 调 出 各 基站 中 的 其 他 手机 号 并 结合 时 空 条 件 进 行 碰 
撞 , 各 基站 均 出 现 的 手机 号 则 很 可 能 就 是 同行 人 员 。@ 对 于 团伙 犯罪 中 能 
够 确定 各 嫌疑 人 身份 和 手机 号 的 ,可 以 调 取 他 们 同一 时 段 手机 基站 信息 进 
行 轨迹 碰撞 ,通过 轨迹 分 布 规律 来 判断 他 们 之 间 的 作案 路 线 及 分 工 。 7 在 
话 单数 据 碰 撞 中 ,还 有 一 个 非常 典型 的 运用 就 是 查找 嫌疑 人 的 新 号 码 一 一 
在 初 查 或 追捕 过 程 中 ,常常 出 现 犯罪 嫌疑 人 更 换 手 机 号 以 逃避 侦查 的 情 
况 , 这 时 候 可 以 调 取 他 的 旧 手 机 话 单 中 3 一 5 位 高 频 常 用 联系 人 , 按 常 理 嫌 
疑 人 即使 更 换 手 机 后 也 仍 会 与 他 们 保持 联系 。 之 后 , 反 调 这 3 一 5 位 常用 
联系 人 的 话 单数 据 进行 碰撞 ,在 他 们 通讯 记录 中 都 出 现 的 新 陌生 号 码 就 很 
有 可 能 是 嫌疑 人 的 新 手机 号 。 ?2 为 了 确保 准确 ,还 可 以 进一步 分 析 “ 新 号 
码 ” 的 通话 记录 曲线 图 谱 ,与 嫌疑 人 旧 手 机 号 的 通话 记录 曲线 图 谱 进行 碰 
撞 、 对 比 。 一 般 而 言 同一 个 人 打 电 话 的 频率 、 规 律 会 保持 一 定 的 稳定 性 ,如 
果 两 份 图 谱 大 概 一 致 便 可 认定 为 两 号 码 归属 为 同一 人 。 

(2) 银行 数据 碰撞 。 随 着 市 场 经 济 转型 的 加 快 和 互联 网 金融 的 兴 
起 ,银行 数据 在 案件 侦查 中 愈 发 起 到 重要 作用 。 尤 其 是 在 贪污 贿赂 犯罪 
中 、 网 络 诈骗 、 网 络 赌博 等 案件 中 ,梳理 银行 流水 数据 对 于 查 明 案件 事实 、 
查找 上 下 游 犯 罪 嫌 疑 人 具有 重要 作用 , 某 些 关键 的 交易 数据 还 有 可 能 作 


51] 斯 进 :《 手 机 话 单 分 析 信息 碰撞 技 战 法 的 应 用 研究 》, 载 (信息 网 络 安全 》,2011(7) 。 
52] 何 洪 辉 , 秦 志 超 :《 综 合 运用 电子 数据 推动 自 侦 工作 转型 发 展 ), 载 ( 反 贪 工作 指导 》， 
2014(2) 。 
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为 最 终 定案 的 证 据 。 在 侦查 中 涉及 交易 数据 的 ,一 般 都 需要 理 清 资金 的 
流向 ,对 于 账户 中 重要 的 资金 流向 进行 梳理 .串联 , 理 清 每 一 笔 重要 资金 、 
交易 的 走向 及 前 后 手 账户 信息 。 在 以 往 的 侦查 中 ,侦查 人 员 往 往 都 是 人 
工 去 逐条 分 析 、 梳 理 案件 中 银行 交易 数据 的 流向 ,需要 耗费 大 量 的 人 力 劳 
动 。 在 大 数据 时 代 , 完 全 可 以 借助 专业 的 大 数据 工具 ,通过 数据 碰撞 来 完 
成 银行 流水 数据 的 分 析 。 具 体 而 言 ,选取 嫌疑 人 及 关联 人 员 的 多 个 银行 
流水 账单 ,将 他 们 海量 的 交易 数据 作为 据 以 碰撞 的 数据 集 ,将 银行 卡号 作 
为 标识 数据 ,对 多 个 账号 交易 数据 进行 碰撞 ,从 而 找 出 共同 的 交易 数据 ; 
并 要 格外 注意 高 频次 交易 账户 、 单 笔 大 额 交易 账户 以 及 敏感 时 段 的 交易 
信息 等 。 





图 5-4 交易 数据 碰撞 图 展示 


(3) 其 他 数据 碰撞 。 除 了 上 述 常用 的 数据 碰撞 法 之 外 ,还 可 以 根据 案 
情 需要 ,灵活 调 取 其 他 数据 资源 进行 碰撞 。 例 如 涉案 物品 碰撞 法 : 盗窃 、 抢 
动 等 案件 中 丢失 的 手机 、 电 脑 、 机 动车 等 物品 一 般 会 流入 二 手 交 易 市 场 ,有 
些 物 品 带 有 了 唯一 的 “身份 识别 号 ”一 一 如 手机 IMEI 号 、 机 动车 发 动机 号 、 电 
脑 序 列 号 等 。 可 以 对 这 些 物品 的 识别 性 号 码 建立 数据 库 ,将 案件 中 遗失 电 
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2010-01-25 15-20:03 村 出 
0 15.40: 但 铺 入 











图 5-5 银行 数据 每 日 交易 曲线 (用 以 发 现 异常 交易 值 ) 


子 物品 识别 码 与 二 手 交 易 市 场 出 售 物品 的 识别 码 数据 进行 碰撞 ,号 码 匹 配 
的 就 可 以 确定 为 同一 物品 ."' 再 如 身份 信息 碰撞 法 : 身份 信息 是 最 常见 
的 标识 数据 之 一 ,如 身份 证 号 .姓名 等 都 能 直接 指向 个 人 。 随 着 社会 中 实 
名 制 的 扩大 化 ,如 网 络 实名 制 汽 车 火车 实名 制 、 上 网 实名 制 、 住 店 实名 制 、 
购物 卡 实名 制 .手机 卡 实名 制 等 ,身份 信息 碰撞 法 的 运用 范围 会 更 加 广泛 。 
通过 身份 数据 碰撞 并 结合 案件 相关 信息 , 则 能 够 获取 大 量 信 息 : 例如 可 以 
将 身份 数据 与 住 店 数据 ,网 吧 上 网 数据 等 进行 碰撞 ,来 获取 其 他 相关 信息 ; 
还 可 以 通过 其 他 数据 碰撞 来 反 查 出 身份 信息 数据 ,例如 得 知 嫌疑 人 在 A、 
B.C 地 均 有 住宿 记录 , 便 可 以 结合 具体 的 时 间 段 调 取 三 地 的 住宿 数据 进行 
碰撞 ,并 从 命中 的 节点 数据 中 锁定 嫌疑 人 的 身份 信息 。 

(4) 轨迹 数据 在 数据 碰撞 中 的 运用 。 轨 迹 数据 是 指 将 多 个 地 理 位 置 数 
据 按 时 间 序列 进行 串联 、 排 列 后 形成 的 反映 人 或 物 位 移行 踪 的 数据 。 随 
着 现代 数据 化 进程 的 加 快 ,很 多 数据 在 生成 的 时 候 都 自动 带 有 时 间 信 息 和 


C51] 陈刚 :《 信 息 化 侦查 教程 ),139 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2014。 
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位 置信 息 , 锁 定 了 数据 的 时 空 维 度 , 也 间接 反映 了 行为 人 或 物 的 历史 时 空 
位 置 ,为 侦查 提供 了 大 量 有 价值 信息 。 轨 迹 碰撞 常常 作为 数据 碰撞 中 的 载 
体 或 媒介 ,发 挥 辅助 作用 ,侦查 人 员 通 过 轨迹 数据 可 以 查找 其 他 信息 。 例 
如 知道 嫌疑 车 辆 逃跑 轨迹 后 ,可 以 调 取 途 经 卡 口 数 据 进行 相互 碰撞 ,共同 
出 现 的 车 辆 便 很 可 能 是 嫌疑 车 辆 :例如 以 手机 基站 数据 为 基础 确定 了 嫌疑 
人 大 致 的 运行 轨迹 后 ,可 以 对 关键 地 理 位 置 周边 的 旅馆 、 网 吧 .车 站 等 数据 
库 进行 逐个 碰撞 分 析 , 从 而 进一步 确定 嫌疑 人 的 落脚 点 行踪 等 线索 。 


第 三 节 数据 挖掘 


数据 挖掘 (data-mining) 是 大 数据 的 核心 技术 。 数 据 挖掘 概念 出 现 的 
时 间 比 大 数据 要 早 ,20 世纪 90 年 代 就 已 经 广泛 使 用 "数据 控 掘 ”了 。 数 据 
挖掘 是 指 在 大 量 的 数据 中 ,自动 发 现 有 用 信息 的 过 程 ,如 果 将 海量 的 数据 
比 作 矿藏 的 话 , 那 么 数据 挖掘 技术 就 是 采矿 工作 。 数 据 挖掘 需要 依靠 统计 
学 \ 人 工 智能 .机 器 学 习 、 数 据 库 技术 .并 行 计算 、 分 布 式 计算 等 多 种 技术 。 
数据 挖掘 主要 包括 以 下 几 种 类 型 的 分 析 技 术 : 关联 性 分 析 , 关 联 性 分 析 
的 任务 是 发 现 不 同 数据 项 之 间 的 关系 。 任 人 类 经 验 可 以 看 出 事物 之 间 显 
而 易 见 的 关联 ,而 数据 挖掘 则 能 够 将 一 些 隐 含 的 .甚至 常理 无 法 理解 的 关 
联 关系 找 出 来 。@ 分 类 分 析 , 分 类 分 析 是 根据 数据 的 特征 为 每 个 类 别 建立 
一 个 模型 ,根据 数据 的 属性 将 其 分 配 到 不 同 组 别 中 。@ 聚 类 分 析 , 聚 类 分 
析 是 指 将 数据 集中 具有 相似 性 的 数据 聚集 在 一 起 。@ 时 序 分 析 , 时 序 分 析 
是 加 了 时 间 因 素 的 关联 性 分 析 , 找 出 数据 在 时 间 上 所 呈现 的 规律 。@@ 异 常 
分 析 , 异 常 分 析 的 任务 是 找 出 数据 集中 明显 不 同 于 既定 模式 的 数据 。 

在 大 数据 侦查 过 程 中 ,数据 挖掘 是 较为 高 级 的 方法 。 由 于 数据 挖掘 的 
技术 性 较 强 ,一 般 需要 运用 到 专门 分 析 软 件 。 现 在 市 面 上 很 多 的 取证 软件 
也 都 自 带 有 数据 挖掘 的 功能 ,如 手机 取证 软件 、 邮 件 分 析 软 件 、 话 单 分 析 软 
件 等 。 数 据 挖掘 的 精 戏 就 在 于 对 海量 数据 进行 二 次 甚至 多 次 分 析 , 发现 
事物 现象 背后 所 隐藏 的 深层 次 规律 。 本 文 以 手机 数据 和 话 单数 据 为 例 ， 


»。 123。 


大 数据 侦查 


来 展示 数据 挖掘 技术 的 具体 应 用 。 
一 、 手 机 数据 挖掘 


手机 已 经 成 为 人 们 日 常生 活 、 工 作 的 必 备 品 , 手 机 数据 挖掘 日 益 成 为 
侦查 工作 的 重要 组 成 部 分 。 现 在 ,人 们 所 使 用 的 手机 主要 是 智能 手机 , 智 
能 手机 相当 于 将 部 分 电脑 功能 与 手机 通讯 功能 相 融 合 ,涉及 人 们 通讯 . 社 
交 、 消 费 、 娱 乐 、 出 行 等 各 个 方面 。 在 大 数据 时 代 , 智 能 手机 能 够 将 人 们 的 
操作 行为 全 数 记录 下 来 ,以 往 物 理 空间 转瞬 即 逝 的 行为 在 手机 中 都 成 为 数 
字 化 痕迹 。 

手机 数据 主要 存储 在 手机 及 内 存 卡 ,SIM 卡 等 载体 当中 ,包括 内 容 数 
据 和 元 数据 两 大 类 型 。 内 容 数据 是 描述 具体 内 容 的 数据 ,如 短信 具体 内 
容 、 即 时 通讯 内 容 、 博 客 内 容 等 ;元 数据 是 描述 数据 的 数据 ,如 发 送 短信 的 
时 间 发 送 的 对 象 , 发 送 的 地 点 等 数据 ,1 手机 数据 挖掘 主要 就 是 对 这 些 
海量 的 元 数据 进行 分 析 , 从 而 发 现 机 主 行为 规律 .兴趣 偏好 等 ,为 案件 侦查 
提供 线索 。 由 于 实务 中 侦查 资料 的 保密 性 ,本 文 以 专业 分 析 软 件 来 对 某 位 
普通 机 主 的 手机 数据 进行 挖掘 ,数据 分 析 结 果 展 示 如 下 。 

1. 手机 及 软件 基本 数据 

取证 软件 首先 提取 手机 的 基本 信息 ,包括 手机 版 本 名称. 电话 号 码 、 
卡号 .识别 码 .序列 码 等 ,其 中 的 “手机 串 号 ”作为 手机 身份 证 ,具有 唯一 的 
识别 性 。 此 外 ,还 可 以 获取 手机 上 安装 的 APP 软件 版 本 .路 径 数据 ,以 及 用 
户 在 各 软件 的 注册 信息 。 在 本 案例 中 ( 见 图 5-6 一 图 5-7), 机 主 的 手机 版 本 为 
iPhone6 ,操作 系统 为 IOS; 机 主 安装 的 软件 有 京东 商城 \ 微 信 、 陌 陌 .百度 贴 
吧 淘宝、 新 浪 微 博 等 ,机 主 在 这 几 个 软件 中 的 注册 账号 都 各 不 相同 。 

2. 通讯 数据 

手机 数据 挖掘 的 一 个 重要 功能 就 是 对 通话 、 短 信和 微 信 等 通讯 元 数据 





51] 内 容 数 据 和 元 数据 之 间 的 划分 也 不 是 绝对 的 。 例 如 “付款 金额 * 可 以 作为 内 容 数据 ,但 
是 其 相对 于 买 了 什么 物品 而 言 , 则 又 是 痕迹 数据 。 

C2] 由 于 涉及 侦查 机 密 , 本 文 没有 使 用 具体 案件 中 嫌疑 人 的 手机 为 例 , 但 所 采用 的 软件 和 挖 
掘 方法 ,与 侦查 实务 中 保持 一 致 
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图 5-6 手机 基本 信息 
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图 5-7 应 用 程序 账号 信息 及 应 用 列表 
的 分 析 。 在 本 案例 中 ,根据 机 主 的 通话 、 短 信和 微 信和 数据 ,可 以 挖掘 出 以 下 
信息 。 

联系 人 信息 。 软 件 能 够 对 机 主 的 通讯 录 中 联系 人 地 理 位 置 进 行 分 析 ， 
并 按照 数量 多 少 进行 排序 。 从 图 5-8 一 图 5-10 中 可 见 , 机 主 联系 人 地 理 位 
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置 分 布 以 北京 和 四 川 为 最 多 ,而 机 主 本 身 居住 在 北京 ,由 此 可 以 推断 四 川 
可 能 是 机 主 的 户籍 地 。 软 件 还 能 够 对 机 主 与 联系 人 的 通讯 频率 进行 分 析 
和 排序 。 由 于 通话 联系 人 和 短信 联系 人 共同 来 源 于 机 主 的 电话 短 ( 未 存储 
姓名 的 以 手机 号 显示 ) ,因而 可 以 将 二 者 共同 进行 频率 分 析 , 同 时 出 现 的 联 
系 人 则 说 明 其 与 机 主 关 系 较为 密切 。 





TENOEETDD 








用 户 关系 图 














图 5-9 通话 联系 人 频率 分 析 
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图 5-10 短信 联系 人 频率 分 析 


每 日 通讯 频率 。 软 件 能 够 对 机 主 平均 每 天 各 时 间 段 的 通讯 频率 进行 
分 析 。 由 图 5-11 一 图 5-13 可 见 , 机 主 的 通话 时 间 较 多 集中 于 上 午 11 点 及 
下 午 3 点 左右 ,晚上 通话 次 数 趋 于 减少 ;发 送 短信 的 频率 同样 集中 于 这 两 
个 时 间 段 ,但 是 在 晚间 短信 发 送 量 下 降 趋 势 并 不 太 明 显 ; 而 微 信使 用 频率 
则 与 通话 记录 短信 记录 呈现 出 完全 不 同 的 规律 , 微 信 使 用 记录 从 早晨 开 
始 呈 现 持续 走高 的 趋势 ,并 在 夜间 10 时 至 12 时 达到 最 高 峰 。 


















































图 5-11 通话 记录 频率 /按时 段 分 布 
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图 5-12 短信 频率 /按时 段 分 布 





图 5-13 微 信使 用 频率 /按时 段 分 布 


整体 通讯 频率 。 整 体 通讯 频率 是 指 对 机 主 在 一 段 时 期 内 的 整体 通讯 
频率 进行 分 析 。 由 图 5-14 一 图 5-16 可 见 , 该 机 主 的 整体 通话 频率 呈 稳 定 的 
波浪 状 , 但 在 圣诞 节 前 后 的 通话 频率 偏 高 ;短信 整体 收发 频率 也 基本 呈 稳 
定 波 浪 状 ,但 在 10 月 31 日 偏 高 ; 微 信和 整体 收发 频率 也 呈 稳 定 波浪 状 ,3 月 
29 日 的 频率 略 偏 高 。 从 图 中 还 可 以 看 出 微 信 收发 数量 明显 高 于 短信 ,可 见 
机 主 更 偏爱 使 用 微 信 收 发 信息 。 在 侦查 实务 中 ,对 于 这 些 偏 高 的 异常 通讯 
数据 要 格外 关注 。 


第 五 章 ”大 数据 侦查 的 方法 























图 5-14 通话 记录 频率 / 按 日 期 分 布 






































图 5-15 短信 频率 / 按 日 期 分 布 


3. 地 理 位 置 数据 

现在 的 智能 手机 一 般 都 带 有 定位 功能 ,除了 手机 本 身 可 以 记录 位 置信 
息 外 ,照片 .第 三 方 软件 及 网 站 等 都 能 够 记录 下 我 们 的 位 置信 息 , 越 来 越 多 
的 软件 需要 用 户 提供 地 理 位 置 以 便 更 好 地 提供 服务 。 就 本 案例 中 的 手机 
而 言 ,以 下 应 用 程序 记录 了 机 主 的 地 理 位 置 。 

照片 定位 系统 对 机 主 的 足迹 进行 记录 。 开 启 照 片 定位 功能 后 ,每 张 昭 
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图 5-16 微 信 使 用 频率 / 按 日 期 分 布 


片 都 可 以 精确 地 记录 下 拍照 的 地 点 ,如 图 5-17 显示 了 曾经 拍照 的 城市 ,对 
每 个 城市 进行 点 击 放大 之 后 ,还 可 以 清晰 到 城市 中 的 具体 位 置 。 侦 查 中 ， 
根据 照片 的 地 点 及 具体 的 拍摄 时 间 等 附属 信息 ,可 以 对 当时 的 拍照 情境 进 
行 大 致 的 还 原 。 

微 信 及 微 博 的 定位 系统 对 机 主 的 足迹 进行 记录 。 开 启 相关 应 用 程序 
的 定位 功能 后 ,应 用 会 记录 下 用 户 地 理 位 置 。 如 微 信 系统 会 记录 下 机 主 曾 
经 共享 ,发送 过 的 地 理 位 置 ; 当 选择 定位 时 , 微 博 应 用 会 记录 下 推送 每 条 状 
态 时 用 户 的 地 理 位 置 见 图 5-17 一 图 5-19。 




















5-17 用 户 轨迹 /照片 中 位 置 
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图 5-19 用 户 轨迹 /新 浪 微 博 位 置 517 


单个 的 地 理 位置 数 据 所 反映 的 信息 可 能 还 比较 有 限 , 如 果 将 机 主 所 有 
的 地 理 位 置 数据 汇集 并 按照 时 间 序 列 进行 排序 , 则 能 够 还 原 出 一 段 时 间 内 
机 主 连 续 的 行为 轨迹 。 在 具体 的 案件 侦查 中 ,还 原 嫌疑 人 的 行踪 轨迹 意义 
重大 ,对 于 抓 捕 在 逃 嫌疑 人 ,获取 沿途 相关 线索 都 具有 重要 作用 。 


[1] 车 发 微 博时 选择 显示 位 置 , 则 微 博 推 送 消 息 的 同时 也 会 记录 位 置信 息 。 
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4. 无 线 网 络 数据 

无 线 网 络 数据 主要 是 记录 手机 在 某 个 时 间 曾 连接 过 哪些 无 线 网 络 。 
侦查 中 ,其 重点 并 不 在 于 连接 过 哪些 无 线 网 络 , 而 是 通过 时 间 和 无 线 网 的 
地 点 ,来 还 原 机 主 在 某 个 时 间 段 的 地 理 位 置 及 场所 信息 ,经 常 出 现 的 无 线 
网 一 般 为 机 主 的 居住 地 .工作 地 或 其 他 经 常 落脚 点 ,从 而 勾勒 出 他 的 活动 
轨迹 见 (图 5-20) 。 


EEC 


民 E20] ss | 双方 已 季 行为 攻 名 全 四 人 
= 2014-12-08 115403 。 李 遇 手机 连 琅 无 二 Wi 本 可 
2014-12-31 13:5742 专员 手机 连理 天 者 9 三 如 | 
2014-12-21 2248:50 Wh 手机 连理 无 二 。 其 呈 1 要 本 | 
2014-12-31 13:5235 。 玉山 手 员 连天 无 颖 。 才 1 天 加 
2014-12-30 19.06:58 。 译员 手机 连理 天 二 1 要 本 | 
四 2014-12-30 203732 。 专员 手册 流 埋 天 经。 要 如 
. 2014-12-30 19:0655 。 地 机 下 机 连 王 天 二 mo Tv wo 三 | 
. 2014-08-01 15:50:18 地 员 手机 连理 天 二 。 贡生 庆 亚 四 
. 2014-12-29 22.04:13 机 手机 连 圭 天 考 。 才 9 要 四 
. 2014-04-10 1043:41 。 本 机 手册 连理 天 二 。 Wi 天 | 
= 2014-12-26 2242:57 。 专员 手机 连 扫 无 二 。 Wi E 如 
. 2014-12-24 12:23:47 。 主轴 机 过 办 天 二 一 一 一 一 一 本 加 
. 2014-12-26 09:26:50 。 本 机 生机 过于 天 绍 一 一 一 ~ 一 5 本 | 
. 2014-12-23 22:4948 直 W 手机 连 捍 无 绩 me 天 加 
2014-12-24 11:2740 。 六 有 生机 连理 无 姓 。 一 一 站 本 | 
2014-04-24 16:02:34 Wh 手册 连理 无 怒 9 mo 5 如 
四 2014-12-21 1244x43 。 村内 手机 连理 无 二 。 关 9 本 本 | 
2014-12-11 21:5437 。 专员 手机 连 境 无线 。 关于 要 本 
2014-12-11 223237 。 专机 手册 连理 无 二 。 0 本 可 
2014-03-22 11:2807 。 可 遇 手册 回报 天 本。 9 0 & 如 
2014-12-05 22:18:49 。 地名 季 员 连理 天 二 0 本 | 
2014-12-04 13.5945 地 员 手中 连接 无 二。 0 0 本 
2014-12-04 14:29:51 。 放电 手机 连 捷 无 本。 mr 0 要 如 | 
2014-12-03 18:08:56 专机 手相 这 摆 天 者。 ~ 一 一 本 加 
2014-12-03 18:10d19 。 二 册 手机 连理 天 二 。 和 寺 0 本 如 
2014-12-03 18:08:48 -Wh 手册 连 夫 无 二 mW 和 本 如 | 
a 2014-12-03 18:09:25 二 加 手机 沪 埋 到 Wi AN 要 如 | 








图 5-20 ”无线 网 络 连接 记录 


二 、 话 单数 据 挖 掘 


侦查 中 也 经 常 对 话 单数 据 进行 挖掘 。 从 表面 上 看 , 话 单数 据 仅仅 记录 
了 通话 行为 ,是 时 间 、 号 码 等 一 连 串 无 序 的 数字 ,但 实际 上 话 单数 据 能 够 挖 
掘 出 机 主 的 人 际 关 系 、 生 活 习性 、 活 动 轨迹 等 诸多 信息 ,为 犯罪 侦查 工作 提 
供 线索 和 方向 。 

目前 ,侦查 机 关 主 要 在 市 一 级 的 通讯 服务 商 处 调 取 话 单 ,一 次 可 以 调 
取 6 个 月 的 通话 记录 ,只 能 调 取 附属 信息 等 元 数据 ,短信 和 内容、 通话 内 容 无 
法 调 取 。 调 取 的 话 单 内 容 主 要 包括 通话 时 间 、 通 话 时 长 通话 号 码 、 归 属 
地 、 基 站 代码 、 费 用 等 数据 。 目 前 ,主要 通过 专业 的 话 单 分 析 工 具 来 进行 数据 
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分 析 。 话 单 分 析 软 件 集 数据 库 技术 数据 挖掘 技术 、 数 据 可 视 化 技术 于 一 体 ， 
在 导入 原始 的 通话 记录 数据 后 ,可 以 自动 对 通话 次 数 时 长 .通话 频率 、 通 话 地 
点 等 信息 进行 分 析 。 在 侦查 实务 中 , 话 单数 据 挖掘 一 般 包 括 以 下 内 容 。 

开户 信息 。 通 过 对 机 主 手 机 号 码 的 反 查 ,可 以 了 解 机 主 开 户 的 基本 信 
息 ,一般 包括 姓名 性别、 身份 证 号 ,开户 地 点 、 创 建 日 期 套餐 业务 等 信息 。 

地 理 位 置 分 析 。 通 过 对 号 码 归属 地 、 基 站 位 置 等 数据 的 挖掘 ,可 以 分 
析出 机 主 的 户籍 地 、 居 住地 .工作 地 等 具体 位 置 。@D 户 籍 地 。 在 流窜 作案 
等 案件 中 ,嫌疑 人 往往 会 逃离 户籍 地 ,但 是 其 还 会 与 户籍 地 的 亲友 保持 联 
系 。 这 时 要 注意 通话 记录 中 高 频率 出 现 的 外 地 号 码 , 尤 其 是 在 春节 、 中 秋 
等 节假日 出 现 的 外 地 号 码 , 其 归属 地 很 可 能 便 是 机 主 的 户籍 地 。@ 居 住 
地 。 一 般 而 言 ,机 主 每 天 最 早 一 个 电话 、 最 晚 一 个 电话 往往 是 在 居住 地 拨 
出 。 通 过 对 每 天 早 、 晚 手机 基站 位 置 的 分 析 , 大 概 可 以 确定 机 主 较 为 精确 
的 居住 地 。@ 基 站 位 置 。 通 过 对 基站 数据 的 获取 ,能 够 对 机 主 进行 定位 ， 
反 查 出 其 何 时 位 于 何 地 的 信息 ( 见 图 5-21)。 








5013:4DF6:;0 图 22547 19959 3 
58F8:7144:0 图 22776 29002 3 


5816:4F54:0 图 26646 20308 
S913:7889;0 图 22547 30905 

5787:6AFB:0 图 22455 35579 1 
S913:4684:0 图 22547 19380 2 
5913:51A9:0 图 22547 20905 3 
S913:4988:0 图 22547 19387 2 
5913:2A99;0 图 22547 10905 2 
S89ExEF92:0 图 22718 61330 ff 
5813:2787:0 图 22547 10167 

566E:7822:0 图 22718 31522 

5813:27AD:0 图 22547 10157 3 





571D:505E:0 图 22301 20574 
6816:51E7:0 图 26646 20967 


5787:7020:0 图 22455 28704 
5813:7885:0 图 22547 30901 
5716:4D4C:0 图 22294 19789 
5820:48D5:9 图 22560 18645 
58FB:6320:0 图 22776 25376 











图 5-21 基站 位 置 分 析 


人 物 关系 分 析 。 不 同人 物 关系 在 通话 频率 上 会 体现 为 不 同 特 征 , 因 而 
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通过 对 机 主 联系 人 通话 频率 的 分 析 , 大 致 可 以 还 原 出 他 们 之 间 的 关系 。 

亲属 关系 。 一 般 而 言 ,通话 时 间 长 ,频次 靠 前 的 号 码 很 可 能 是 亲属 。 他 
们 通话 时 间 大 都 是 非 工 作 时 间 , 在 排除 情人 关系 后 , 便 可 大 致 确定 亲属 关 
系 。 四 情人 关系 。 在 很 多 案件 尤其 是 职务 犯罪 案件 侦查 中 ,嫌疑 人 拥有 一 
个 甚至 多 个 情人 ,情人 的 通话 时 间 多 在 深夜 或 凌晨 , 单 次 通话 时 间 长 ,通话 
频率 高 ,呈现 不 眠 不 休 的 特征 。@ 同 事 关系 。 一 般 而 言 ,工作 时 间 通 话 且 
每 次 通话 时 间 不 长 的 很 可 能 是 同事 ,工作 时 间 频 率 较 高 的 通话 可 能 意味 着 
两 人 有 着 较为 密切 的 业务 联系 。@ 同 伙 关 系 。 在 一 些 团 伙 犯 罪案 件 中 犯罪 
嫌疑 人 需要 通过 手机 与 同 案犯 联系 ,需要 注意 在 案件 发 生前 后 的 通话 记录 、 
案 发 地 点 的 通话 记录 ,对 方 很 有 可 能 是 犯罪 同伙 。@@ 其 他 关系 。 在 亲属 、 同 
事 、 情 人 关系 外 ,还 有 些 其 他 特殊 通话 关系 需要 引起 注意 。 如 在 职务 犯罪 案 
件 侦 查 中 ,与 机 主 联系 频繁 的 公司 ` 企 业 人 员 等 ,他 们 很 可 能 是 潜在 的 行贿 人 
( 见 图 5-22 一 图 5-23)。 此 外 ,对 同 案 中 多 个 嫌疑 人 话 单数 据 同 时 挖掘、 比 对 ， 
还 可 以 分 析出 共有 联系 人 等 信息 ,从 而 为 了 解 同 案 中 的 人 物 关 系 提 供 依据 。 











是 让 让 号 蚌 直 证 基 项 直 基 训 二 站 基 关 荐 居间 生 雪 各 是 各 荐 这 量 豆 二 去 





图 5-22 ”通话 频率 分 析 
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图 5-23 重点 联系 人 通话 时 段 分 析 513 


行动 轨迹 分 析 。 通 过 话 单 中 的 主 叫 号 码 归属 地 、 基 站 代码 的 串联 ,可 
以 勾画 出 嫌疑 人 的 主要 活动 轨迹 。@ 日常 行 动 轨 迹 。 通 过 机 主 早晚 电话 
的 基站 ,可 以 判断 出 其 起 居 地 ;通过 工作 时 间 的 基站 代码 ,可 以 判断 出 其 工 
作 地 点 ;单位 和 家 之 外 ,有 可 能 是 机 主 有 多 处 居住 地 或 是 情人 居住 地 。 
加 案 发 时 行动 轨迹 。 对 于 案 发 前 和 案 发 当日 的 基站 信息 要 格外 注意 ,其 往 
往 反映 了 嫌疑 人 的 犯罪 准备 工作 及 作案 路 线 。 贺 案 发 后 行动 轨迹 。 案 发 
后 ,有 些 嫌 疑 人 会 迅速 逃匿 或 是 与 同 案犯 会 合 。 通 过 对 案 发 后 基站 轨迹 的 
梳理 ,可 以 掌握 嫌疑 人 逃跑 行踪 及 同 案犯 的 一 些 信息 ( 见 图 5-24) 。 

特殊 情况 。 需 要 注意 的 是 ,在 案件 侦查 中 ,嫌疑 人 的 通话 规律 并 非 是 一 
成 不 变 的 ,一 些 特殊 的 通话 记录 反倒 有 可 能 是 重要 的 侦查 信息 ,需要 对 其 进 
一 步 分 析 。 例 如 深夜 ,节假日 、 案 发 日 等 敏感 时 段 的 通话 记录 ;如 通话 频率 过 
高 .累计 通话 时 间 过 长 的 联系 人 ;再 者 ,以 日 期 为 坐标 对 每 日 通话 规律 进行 分 
析 , 明 显 区 别 于 平日 通话 记录 的 时 间 需 要 引起 注意 ;此 外 ,外 地 号 码 、 漫 游 号 


51] 该 图 片 来 源 于 网 络 。 
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5-24 和 运动 轨迹 分 析 


码 、 座 机 号 码 、 特 服 号 码 等 也 要 注意 。 另 外 ,不 同类 型 案件 中 , 话 单 分 析 的 侧 
重点 也 不 一 样 。 以 行为 轨迹 分 析 为 例 ,一 般 抢 动 .杀人 、 强 奸 等 案件 中 , 案 发 
当日 嫌疑 人 的 行踪 轨迹 对 于 确定 具体 案情 则 具有 重要 作用 。 而 在 职务 犯罪 
侦查 中 , 案 发 当日 往往 难以 确定 ,即使 是 知道 案 发 日 ,由 于 作案 手段 的 隐蔽 
性 ,也 不 会 在 行踪 上 有 特殊 体现 ,因而 侧重 点 可 能 要 放 到 嫌疑 人 日 常 轨 迹 的 
分 析 以 及 人 物 关系 的 分 析 上 一 一 业务 关系 人 、 上 下 级 关系 以 及 情人 关系 是 重 
点 分 析 对 象 ,业务 关系 人 可 能 是 潜在 的 行贿 人 ,情人 可 能 参与 了 受贿 活动 。 
因此 ,侦查 人 员 要 根据 案件 的 具体 情况 选择 不 同 的 数据 分 析 侧重 点 。 


第 四 节 数据 画像 


一 、 数据 画像 的 原理 


数据 画像 是 随 着 大 数据 时 代 的 到 来 而 产生 的 新 事物 ,在 商业 领域 运用 
较为 广泛 。 商 户 根据 用 户 数据 来 对 消费 者 的 特征 进行 归纳 ,分 析 他 们 的 消 
费 习 惯 .行为 习惯 等 ,并 据 此 进行 个 性 化 营销 服务 ,这 被 称 为 "大 数据 用 户 
画像 ”的 营销 模式 。 尤 其 是 在 电子 商务 领域 ,积累 了 大 量 高 质量 .多 维度 的 
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用 户 数据 ,为 用 户 画 像 提供 了 丰富 的 数据 矿藏 。 大 数据 用 户 画 像 能 够 对 每 
一 位 用 户 进行 精准 的 个 性 画像 ,将 用 户 的 信息 细 化 为 不 同 的 特征 ,如 性 别 、 
年 龄 .地 域 . 兴 趣 爱好 、 收 入 水 平 、 消 费 偏好 等 ;再 通过 各 种 标签 去 展示 用 户 
的 个 性 化 特征 ,如 年 龄 标签 .地 域 标签 .职业 标签 ,收入 标签 等 :最 后 ,商家 
根据 用 户 的 不 同 特征 展开 不 同 的 营销 策略 。 概 言 之 ,用 户 画 像 能 够 将 人 物 
特征 转化 为 虚拟 的 数据 ,来 代表 个 人 的 背景 需求 、 喜 好 等 ,从 而 加 强 商 家 
与 用 户 之 间 的 交流 ,有 助 于 商家 更 好 地 满足 用 户 的 需求 。"1 (如 图 5-25) 











图 5-25 京东 用 户 画 像 模 板 


这 种 商业 化 的 “数据 画像 ”模式 ,在 侦查 中 同样 可 以 用 于 对 嫌疑 人 的 画 
像 。 追 根 溯源 ,其 实 侦查 中 数据 画像 最 早 可 以 追溯 到 “犯罪 心理 画像 ” 
(criminal profiling)。 犯 罪 心理 画像 是 指 侦查 人 员 根 据 犯罪 现场 遗留 的 痕 
迹 、 物 证 等 信息 ,结合 主观 经 验 判断 ,来 对 犯罪 嫌疑 人 的 外 形 、 身 份 ,心理 活 
动 等 进行 描绘 的 过 程 .2 在 过 去 ,对 犯罪 分 子 特 征 的 描述 来 源 于 对 个 案 中 


51] 余 乔 杰 :《 产 品 研发 中 用 户 画 像 的 数据 模 建 一 -从 具象 到 抽象 ), 载 (设计 艺术 研究 》， 
2014(6) 。 

52] 李 玫 瑾 :《 侦 查 中 犯罪 心理 画像 的 实质 与 价值 ), 载 (中 国人 民 公 安 大 学 学 报 )( 社 会 科学 
版 ) ,2007(4)。 
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的 犯罪 现场 ,物证 ,行为 证 据 等 考察 。 在 大 数据 时 代 , 对 犯罪 分 子 的 心理 画 
像 完全 可 以 通过 数据 来 完成 ,侦查 实务 中 也 有 越 来 越 多 的 学 者 开始 提出 
“数据 画像 ”的 概念 。 侦 查 中 的 数据 画像 是 指 通过 大 数据 分 析 方 法 ,对 嫌疑 
人 或 相关 人 的 身份 .行为 特征 、 兴 趣 爱好 .人 际 关 系 等 情况 以 数据 形式 表现 
出 来 ,刻画 出 分 析 对 象 的 数据 全 貌 ,为 犯罪 侦查 活动 提供 线索 、 信 息 。 

侦查 中 用 于 犯罪 画像 的 数据 来 源 非常 广泛 ,包括 侦查 机 关 的 数据 
库 数 据 、 社 会 行业 的 数据 库 数 据 、 大 数据 公司 的 用 户 数 据 、 个 人 电子 设 
备 中 的 数据 ,等 等 。 所 选取 的 数据 源 越 多 ,对 嫌疑 人 特征 的 刻画 就 越 具 
体 ,对 嫌疑 人 行为 特征 的 总 结 就 更 精确 ,侦查 机 关 所 能 获取 的 信息 也 就 
越 多 (如 图 5-26)。 






。 其 本 身份 信息 ， 婚 姻 。 住 房 信息 、 公 积 金 
信息 ， 家 庭 关 系 ， 车 信息 、 纳税 信息 、 
辆 信息 ， 上 网 信息 ， 计生 信 息 、 i 
暂 住 信息 ， 银 行 存 取 人 
款 信息 ， 人 车 、 汽 Ri 


车 信息 . 








。 用 户 所 提供 的 注册 信息 ， ee 


用 户 所 存储 的 内 容 信息 信 

即时 通讯 信息 :联系 人 
rr 信息 、 购 物 行为 足迹 
位 时 数据 等 


图 5-26 数据 画像 数据 来 源 


数据 画像 是 一 个 从 具体 到 抽象 的 层 层 递 进 的 分 析 过 程 。 首 先 ,通过 海量 
的 数据 源 ,获取 有 关 对 象 的 最 基本 相关 数据 ,这 些 数据 往往 是 海量 的 ,杂乱 
的 ;在 此 基础 上 ,侦查 人 员 要 对 这 些 初始 数据 进行 归纳 .总结 ,运用 数据 挖掘 
等 方法 分 析 这 些 数据 的 特征 ,形成 类 似 于 商业 数据 画像 中 的 “标签 化 展示， 
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从 而 逐渐 完成 数据 画像 过 程 。 在 大 数据 画像 技术 下 ,嫌疑 人 无 疑 会 成 为 大 
数据 底下 的 透明 人 ,其 身份 信息 ,行为 轨迹 、 消 费 习性 .经 济 状况 .家 庭 关 
系 、 兴 趣 爱 好 、 人 际 交 往 等 特征 得 以 完整 以 展现 出 来 ,从 而 为 犯罪 侦查 提供 
大 量 线索 ,情报 ,侦查 人 员 也 可 以 结合 案情 ,就 任 一 特征 继续 深 挖 下 去 (如 
图 5-27) 。 














一 级 数据 身份 标签 行为 标签 和 兴趣 标签 
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图 5-27 数据 画像 原理 


二 、 数据 画像 的 示例 


目前 在 实务 中 ,已 经 不 少 地 区 的 侦查 部 门 开 始 运用 大 数据 画像 技术 。 
就 笔者 所 知 ,江苏 省 某 市 检察 院 的 大 数据 画像 运用 走 在 全 国 前 列 。 该 市 检 
察 院 依托 于 2 000 余 万 条 拷贝 类 信息 库 、10 余 条 实时 连 线 信息 查询 通道 、 
10 000 余 条 已 办 案件 信息 等 三 大 信息 库 组 成 基本 的 数据 平台 ;在 其 查办 的 
每 一 起 职务 犯罪 案件 中 , 侦查 人 员 都 会 对 嫌疑 人 进行 基本 的 数据 画像 , 选 
取 其 话 单数 据 . 手 机 数据 ` 银 行 数据 房产 数据 ,出 入境 数据 作为 画像 的 数 
据 源 ;在 此 基础 上 ,侦查 人 员 通 过 大 数据 智能 挖掘 和 人 工分 析 研 判 ,对 每 位 
嫌疑 人 的 基本 信息 、 人 际 关系 、 资 产 情况 等 进行 画像 。 再 如 ,福建 省 某 市 检 
察 院 的 “智慧 检察 大 数据 分 析 平 台 ”, 同 样 具有 数据 画像 的 功能 ,其 能 将 有 
关 犯 罪 嫌 疑 人 的 碎片 数据 收集 整合 ,对 其 家 庭 情况 、 人 际 交 往 情况 、 消 费 情 
况 等 维度 进行 画像 。 反 贪 实务 中 ,通过 数据 画像 ,侦查 人 员 能 够 在 短 时 间 
内 对 犯罪 嫌疑 人 有 较为 深入 的 了 解 ,有 利于 侦查 人 员 提 出 侦查 假说 ,制订 
可 行 的 侦查 方案 ,确定 有 效 的 审讯 谋略 ,有 利于 侦查 人 员 对 全 案 侦查 进程 
的 把 控 。 
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第 五 节 犯罪 网 络 关系 分 析 


一 、 犯 罪 网 络 关系 分 析 的 缘起 


在 当今 的 大 数据 时 代 ,社交 网 络 平台 很 流行 通过 用 户 之 间 的 社交 网 络 
关系 ,描绘 出 用 户 之 间 的 关系 图 。 即 以 用 户 为 中 心 , 根 据 该 用 户 与 其 他 网 
络 用 户 的 联系 频率 、 互 动 频率 、 兴 趣 相似 度 、 共 同好 友 数 量 等 指标 建立 联 
系 , 并 根据 这 些 指标 测算 出 不 同 用 户 之 间 的 关系 强 弱 。 例 如 下 图 就 是 以 
“ev” 为 核心 人 物 的 社交 网 络 关系 分 析 图 ,图 5-28 中 显示 出 "ev 社交 网 络 中 
的 所 有 联系 人 ,以 及 这 些 联系 人 之 间 的 相互 关系 。 社 交 网 络 关系 分 析 一 般 应 
用 于 社交 网 站 的 消息 推送 、 好 友 推 送 、 产 品 推送 等 商业 用 途 。( 如 图 5-28) 
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图 5-28 “ev” 的 twitter 的 社交 关系 ( 注 : 该 图 片 来 源 于 网 络 ) 
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其 实 ,社交 网 络 关系 分 析 并 不 是 新 事物 ,其 来 源 于 20 世纪 30 年 代 就 出 
现 的 社会 网 络 分 析 。 社 会 网 络 分 析 涉 及 心理 学 .人 类 学 .数学 等 多 学 科 的 
知识 , 旨 在 将 复杂 多 样 的 人 际 关系 变 为 形象 的 网 络 图 形 , 通 过 群体 及 个 体 
的 关系 来 展开 研究 ,并 用 于 社会 各 个 领域 的 需求 .2 早期 的 社会 网 络 分 析 
多 采取 图 论 法 ,矩阵 法 等 手绘 方法 ,后 来 计算 机 技术 开始 运用 到 分 析 制 图 中 。 

犯罪 网 络 分 析 与 社交 网 络 分 析 的 原理 本 质 上 是 相同 的 。 犯 罪 活动 首 
先是 一 种 社会 活动 ,犯罪 网 络 也 是 社会 网 络 的 一 种 体现 ,因而 社会 网 络 分 
析 的 原理 同样 可 以 运用 于 犯罪 网 络 关系 分 析 中 。 在 很 多 犯罪 活动 中 ,往往 
具有 群体 性 的 特点 ,犯罪 成 员 呈 组 织 化 .团伙 化 的 形式 ,他 们 之 间 有 着 明确 
的 分 工 、 各 司 其 职 、 互 相配 合 。 犯 罪 成 员 之 间 的 这 种 关系 恰恰 是 社会 关系 
在 犯罪 中 的 一 种 表现 ,因而 可 以 通过 社会 网 络 分 析 来 了 解 犯罪 群体 的 人 员 
组 织 及 其 之 间 的 分 工 联系 。 这 种 对 犯罪 活动 中 群 成 员 的 相互 连接 .分 工 合 
作 关 系 的 分 析 就 被 称 为 “犯罪 网 络 分 析 ”。 犯 罪 网 络 分 析 方法 适用 于 所 有 
的 有 组 织 犯 罪 , 如 恐怖 组 织 犯 罪 、 黑 社会 性 质 的 组 织 犯罪 等 。 尤 其 是 现在 
随 着 网 络 犯罪 的 扩大 化 ,很 多 犯罪 分 子 都 在 网 上 进行 联系 ,他 们 的 网 络 联 
系 、 交 往 痕迹 为 犯罪 网 络 分 析 提 供 了 有 利 的 "数据 条件, 可 以 通过 他 们 的 
即时 通讯 数据 .社交 数据 等 来 还 原 出 犯罪 网 络 关系 图 。 

犯罪 网 络 分 析 对 于 案件 侦查 具有 重要 作用 。 首 先 , 有 助 于 侦查 人 员 获 
取 犯 罪 分 子 的 全 面 信息 以 及 他 们 之 间 的 分 工 合作 关系 ,尤其 是 在 一 些 组 织 
庞大 的 犯罪 活动 ,如 慌 怖 犯罪 毒品 犯罪 活动 中 ,如 果 不 通 过 犯罪 网 络 关系 
分 析 , 则 很 难 获取 所 有 犯罪 成 员 之 间 的 组 织 信息 ,不 利于 对 犯罪 组 织 的 全 
面 打击 。 其 次 ,通过 犯罪 网 络 分 析 , 能 够 很 清晰 地 显示 出 犯罪 组 织 中 的 核 
心 成 员 .中介 性 成 员 , 可 以 以 他 们 为 突破 口 ,挖掘 进一步 的 犯罪 网 络 关 系 。 
对 核心 成 员 .中 介 成 员 的 打击 ,有 利于 迅速 瓦解 犯罪 组 织 ,提高 打击 犯罪 的 
效率 。 最 后 ,现在 日 益 独 狐 的 网 络 犯罪 活动 ,其 成 员 之 间 的 联系 、 分 工 合作 
都 是 在 网 络 上 完成 的 ,如 果 不 进行 专业 的 犯罪 网 络 分 析 , 仅 凭 侦查 经 验 则 





5C1] 邵 云 飞 ,欧阳 青 燕 、 孙 雷 :《 社 会 网 络 分 析 方 法 及 其 在 创新 研究 中 的 运用 》, 载 4 管理 学 
报 》,2009(9) 。 
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很 难 摸 清 其 组 织 成 员 的 构成 及 其 分 工 合作 关系 。 
二 、 犯 罪 网 络 关系 分 析 的 原理 及 示例 


早期 的 犯罪 网 络 分 析 主 要 是 通过 人 工 计 算 来 完成 ,如 美国 最 早 使 用 链 
接 分 析 (link analysis) 来 解析 犯罪 组 织 之 间 的 网 络 关系 。 不 过 犯罪 组 织 之 
间 的 成 员 关 系 错综复杂 ,他们 之 间 的 通讯 .联系 记录 动 辑 数 以 千 计 ,对 其 
关系 的 分 析 计 算 无 疑 是 项 浩大 的 工程 。 在 如 今 的 大 数据 时 代 , 我 们 完全 
可 以 通过 数据 挖掘 技术 来 完成 犯罪 网 络 分 析 , 自动 分 析 犯 罪 成 员 间 的 互 
动 关系 ,识别 出 核心 人 物 .中 介 性 成 员 等 。 当 下 的 话 单数 据 ` 社 交 网 络 数 
据 `. 即 时 通讯 数据 .邮件 来 往 数 据 等 都 为 犯罪 网 络 关系 图 提供 了 数据 

犯罪 网 络 分 析 的 任务 就 是 对 犯罪 成 员 之 间 的 联系 亲密 度 . 亲 下 度 等 进 
行 定 量 计 算 ,将 犯罪 组 织 成 员 之 间 的 关系 通过 网 络 图 的 形式 呈现 出 来 。 犯 
罪 成 员 之 间 的 关系 和 重点 嫌疑 人 都 是 犯罪 网 络 分 析 的 重要 内 容 。 中 犯罪 
成 员 之 间 的 关系 分 析 。 在 有 组 织 性 的 犯罪 中 ,每 个 犯罪 成 员 用 一 个 “节点 ” 
来 表示 ,如 果 他 们 之 间 有 联系 , 则 用 “ 连 线 ” 来 表示 。 犯 罪 成 员 之 间 的 交往 
的 密切 程度 可 以 通过 联系 频率 、 联 系 时 长 .联系 天 数 的 数值 计算 出 来 ,并 表 
现 为 不 同 粗细 长短 的 连 线 。 一 般 来 说 ,核心 成 员 之 间 的 关系 、 家 庭 亲 属 关 
系 、 同 籍 关系 .同学 关系 都 是 较 强 的 连 线 关 系 。 四 重点 嫌疑 人 分 析 。 重 点 
犯罪 嫌疑 人 筛选 的 依据 在 于 核心 度 测量 ,其 包括 中 心性 指标 `. 中 介 性 指标 、 
接近 性 指标 。 中 心性 是 指 该 人 物 节 点 与 群体 中 其 他 人 员 的 连 线 数 量 , 中 心 
性 越 大 说 明 在 犯罪 活动 中 越 处 于 核心 地 位 :中 介 性 是 指 该 人 物 节 点 在 整体 
人 物 关系 图 中 所 起 的 连接 作用 ;" 接近 性 是 指 该 人 物 在 整体 人 物 关 系 中 达 
到 其 他 人 的 路 径 总 和 ,接近 性 指标 越 小 说 明 核心 度 越 高 。 


51] 如 果 设 网 络 中 任意 两 点 间 最 短路 径 的 总 数 为 S, 其 中 有 nn 条 最 短路 径 通过 了 某 一 节点 
& ,节点 a 的 中 介 性 指标 等 于 n 除 以 S, 节 点 占有 的 最 短路 径 越 多 , 则 这 一 节点 对 网 络 其 他 节点 就 越 
重要 ,这 类 节点 丧 失常 常会 导致 网 络 的 瘫 奖 或 解体 。 崔 党 :《 再 造 公安 情报 》,209 页 ,北京 ,中 国人 
民 公 安 大 学 出 版 社 ,2008。 
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犯罪 网 络 分 析 一 般 遵 循 如 下 的 流程 : 确定 初始 人 物 节点 : 在 有 组 织 
的 犯罪 中 ,侦查 人 员 可 以 将 某 几 个 犯罪 嫌疑 人 作为 突破 口 ,绘制 出 数 个 初 
始 节 点 ; 加 一 级 犯罪 关系 网 络 分 析 : 通过 对 初始 人 物 的 社交 关系 、 人 际 关 
系 的 监控 ,来 绘制 出 以 他 为 核心 的 关系 图 ,寻找 与 之 有 密切 联系 的 关系 人 ; 
加 联系 强 弱 分 析 : 根据 相关 指标 模型 ,分 析 各 犯罪 分 子 之 间 的 亲 玻 联系 ; 
@ 二 级 犯罪 网 络 关系 分 析 : 再 以 一 级 犯罪 网 络 中 与 核心 分 子 关系 密切 的 其 
他 可 疑 分 子 为 核心 ,绘制 二 级 人 际 关系 图 ;通过 这 样 层 层 扩 大 的 方法 ,最 终 
绘制 出 完整 的 犯罪 网 络 关系 图 .12 在 数据 挖掘 模型 下 ,犯罪 网 络 关系 图 往 
往 呈 现 出 类 似 于 神经 网 络 图 的 分 布 模式 (如 图 5-29)" ?7。 
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Ce Force 
[8 Force-directed tree 











图 5-29 犯罪 网 络 关 系 分 析 原 理 





“9。11” 事 件 中 的 恐怖 组 织 分 析 便 是 一 起 典型 的 犯罪 网 络 关系 分 析 案 
例 。 美 国 国 家 安全 局 曾 在 “9。11” 恺 怖 犯罪 发 生 以 后 ,根据 AT&T， 
Verizon, BellSouth 三 家 美国 电信 公司 的 通讯 记录 ,绘制 出 了 恺 怖 分 子 网 络 





C1] 崔 沉 :《 再 造 公安 情报 》,194 一 195 页 .208 一 209 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ， 
2008。 

C52] 图 片 来 源 于 ECharts 的 开源 工具 , 载 百 度 网 http://echarts. baidu. com/doc/example/force2. 
html, 最 后 访问 时 间 : 2016 年 9 月 28 日 。 不 过 这 仅仅 是 犯罪 网 络 关 系 分 析 图 的 代表 形式 之 一 。 
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Flight AA #77 - Crashed Into Pentagon 
Flight UA £93 - Crashed in Pennsylvania 
Flight UA #175 - Crashed into WTC South 
本 Other Associates of Hijackors 
Copyngt © 2001. Von eps 





图 5-30 “9。11” 犯 罪 中 恐怖 分 子 网 络 关系 


图 ,著名 社会 网 络 关系 专家 Valdis Krebs 也 曾 绘制 “9。11? 秃 怖 分 子 关系 
图 (如 图 5-30)522 ,从 中 我 们 可 以 看 出 处 于 中 间 位 置 . 连 线 数量 较 多 的 人 物 
为 Mohamed Atta Hani Hanjour Marwan Al-Shehhi、 Nawaf Alhazmi 等 ， 
他 们 恰恰 都 是 在 "9。11” 恕 怖 袭击 中 重要 参与 者 。 试 想 ,若是 及 早 发 现 这 
些 恐 怖 分 子 之 间 的 联系 ,或 许 就 能 够 阻止 这 一 场 灾 难 了 。'?， 随 着 全 球 铠 怖 
主义 威胁 的 日 益 严 重 ,目前 越 来 越 多 的 组 织 开 始 研发 专门 针对 恐怖 活动 犯 
罪 网 络 分 析 的 数据 挖掘 方法 ,如 美国 卡 内 基隆 大 学 基于 贝 叶 斯 算法 研发 的 
NETEST 工具 ,亚利桑那 州立 大 学 通过 极端 主义 论坛 活动 来 构建 恐怖 犯 
罪 网 络 关 系 , 南 加 利 福 尼 亚 州 大 学 通过 相似 性 算法 ,寻找 与 恺 怖 分 子 具 


Cl1] 图 片 来 源 于 http://orgnet. com/about. html 网 站 ,最 后 访问 时 间 : 2015 年 12 月 15 日 。 
52] 参见 新 浪 科 技 :《 快 速 锁定 恐怖 分 子 新 招数 :绘制 “联系 人 网 络 图 ”》, 载 新 浪 网 http://tech. 
sina. com. cn/ d/i/2015-12-01/ doc-ifxmazmy2303998. shtm, 最 后 访问 时 间 : 2016 年 9 月 25 日 。 
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有 相似 性 的 对 象 等 方法 .5 实际 上 , 恺 怖 活动 中 的 犯罪 网 络 分 析 原 
理 、 方 法 同样 可 以 适用 于 毒品 犯罪 、 洗 钱 犯 罪 以 及 有 组 织 的 网 络 犯 罪 
中 。 目 前 ,我 国 侦查 机 关 对 于 犯罪 网 络 分 析 的 了 解 、 运 用 还 不 是 很 多 ， 
相关 技术 也 尚未 成 熟 , 或 许 犯 罪 网 络 分 析 会 成 为 未 来 大 数据 侦查 方法 
的 发 展 方向 之 一 。 


第 六 节 ”犯罪 热点 分 析 


一 、 犯 罪 热 点 分 析 的 原理 


经 济 学 上 有 一 个 著名 的 “二 八 定律 ”, 用 来 说 明 事物 分 布 不 平衡 的 道 
理 。 人 类 的 犯罪 活动 同样 遵循 着 不 平衡 理论 ,相对 于 整体 犯罪 而 言 ,少量 
犯罪 和 人群 可 能 实施 了 大 部 分 的 犯罪 活动 , 少 部 分 地 区 发 生 了 大 部 分 的 犯罪 
活动 ,少量 的 时 间 段 发 生 了 大 部 分 的 犯罪 。“ 二 八 定律 ”在 犯罪 地 理 空间 中 
的 表现 被 称 之 为 “犯罪 热点 ?现象 ,强调 犯罪 活动 在 空间 上 呈现 出 的 一 种 聚 
集 现象 , 某 些 区 域内 的 犯罪 密度 显著 偏 高 ."? ”也 有 学 者 认为 除了 地 理 空间 
的 犯罪 热点 外 ,广义 犯罪 热点 还 可 以 加 上 时 间 . 人 和 群 .犯罪 类 型 等 维度 。 3 

犯罪 热点 一 般 有 着 潜在 的 分 布 规律 ,可 以 通过 对 某 一 地 区 历史 犯罪 数 
据 的 计算 来 确定 其 犯罪 热点 。 具 体 方 法 可 以 在 区 域 犯罪 数据 统计 或 离散 
点 统计 基础 上 ,运用 大 数据 算法 来 探测 犯罪 热点 ."， 关于 犯罪 热点 分 析 ， 


同 。 对 一 定 区 域内 犯罪 热点 可 以 进行 犯罪 密度 分 析 , 并 根据 不 同 的 犯罪 密 
度 分 别 对 每 个 地 区 进行 不 同 的 染色 ,一 般 颜色 越 深 的 表示 犯罪 密度 越 


51] 马 方 : 《犯罪 网 络 分 析 : 恐怖 主义 犯罪 防 控 新 视角 》, 任 惠 华 主编 :《 侦查 学 演讲 录 》， 
458 一 486 页 ,北京 ,法律 出 版 社 ,2010。 

52] 汪 兰 香 、 陈 友 飞 、 李 民 强 等 :《 犯 罪 热点 研究 的 空间 分 析 方 法 ), 载 (福建 警察 学 院 学 报 》， 
2012(2) 。 

53] 陆 娟 等 :《 犯 罪 热 点 时 空 分 布 研究 方法 综述 ), 载 (地 理科 学 研究 进展 ),2012(4) 。 

[4] 同上 注 。 
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高 .5 @ 犯 罪 热点 分 析 往往 与 犯罪 预测 工作 联系 在 一 起 。 在 犯罪 地 理 空 
间 分 布 模式 分 析 中 可 以 加 入 时 序 因素 ,将 犯罪 地 理 空 间 特 征 与 时 间 特 征 相 
结合 ,探索 犯罪 活动 的 时 空 模式 特征 ,了 解 犯罪 热点 .犯罪 密度 等 在 时 间 上 
的 变化 趋势 和 规律 。 在 此 基础 上 ,就 能 够 对 未 来 该 地 区 犯罪 活动 的 发 生 概 
率 进 行 预测 。 


二 、 犯罪 热点 分 析 的 示例 


TY 


信息 系统 。GIS 地 理 信息 系统 原本 是 对 全 球 地 理 数据 进行 采集 .存储 和 分 
析 的 系统 ,其 作为 专业 的 地 理 数据 分 析 系 统 , 逐 渐 应 用 至 气象 .土地 ` 测 绘 、 
经 济 管理 .刑事 侦查 等 各 个 领域 。GIS 技术 的 一 个 特点 是 将 不 同 的 地 理 特 
征 分 为 不 同 的 层次 ,例如 将 某 个 城市 的 道路 数据 ` 建 筑 物 数据 .水管 数据 、 
娱乐 场所 数据 等 不 同 的 地 理 信息 分 别 设置 为 不 同 的 层次 ,并 根据 任务 需要 
选取 不 同 的 层次 进行 到 加 对 比 。 侦 查 工作 中 ,GIS 提供 一 个 以 地 理 位 置 为 
基础 的 分 析 平 台 , 能 够 对 犯罪 数据 、 地 理 数据 以 及 一 些 其 他 相关 数据 进行 
到 加 比较 ,分 析 数 据 之 间 的 关联 性 ,找到 犯罪 活动 与 地 理 环境 之 间 的 关系 。 
本 文 以 A 地 区 抢 动 案件 犯罪 热点 的 分 析 为 例 , 来 说 明 GIS 系统 运用 的 流程 
及 原理 。5?] 

(1) 目标 任务 : 寻找 A 地 区 抢劫 案件 的 热点 地 区 ,以 及 抢劫 案件 与 地 
理 因 素 之 间 的 关系 

(2) 数据 选取 : A 地 区 过 去 两 年 包含 有 地 址 的 抢劫 案件 数据 ; 

(3) 数据 清洗 : 对 犯罪 地 址 数据 进行 编码 ,并 进行 数据 清洗 ,统一 数据 
格式 、 纠 正 、 补 缺 错误 及 缺失 的 地 址 数据 等 ,保证 犯罪 地 址 数据 的 一 致 性 、 
准确 性 、. 可 靠 性 和 完整 性 ; 


51] 崔 凯 :《 再 造 公 安 情报 ),353 一 354 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2008。 
52] [ 英 ]Spencer Chainey,[ 美 JJerry Ratcliffe:《 地 理 信 息 系统 与 犯罪 制图 》, 陈 鹏 、 洪 卫 军 、 
绷 晋 光 等 译 ,27 一 56 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2014。 
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(4) 数据 处 理 : 将 犯罪 地 址 数据 投射 到 地 图 上 去 ,通过 其 地 理 位 置 分 
别 来 判断 ,分 析 A 地 区 抢 动 案件 的 热点 。 根 据 具 体 需 求 ,侦查 人 员 还 可 以 
选择 不 同 的 地 理 图 层 , 进 行 关联 性 分 析 , 例 如 选择 人 口 数 据 ,来 比较 抢 动 案 
件 与 人 口 之 间 的 关系 ;选择 ATM 及 银行 数据 ,分 析 抢 动 案件 与 这 些 地 点 之 
间 的 关系 ;选择 酒吧 夜总会 等 娱乐 场所 数据 来 进行 分 析 等 。 尽 管 大 数据 
分 析 技 术 能 够 解放 人 力 劳动 ,对 犯罪 活动 进行 智能 化 分 析 , 但 是 在 分 析 犯 
罪 原 因 以 及 犯罪 相关 性 因素 的 时 候 , 仍 然 需 要 侦查 人 员 的 工作 经 验 以 及 犯 


罪 学 基本 理论 ; 
(5) 决策 运用 : 警方 根据 A 地 区 抢劫 犯罪 热点 来 进行 犯罪 预测 ,并 在 


热点 地 区 加 强 警力 巡 逮 力量 ,增加 监控 视频 ,并 提醒 该 地 区 居民 加 强 防范 
意识 ;根据 抢劫 案件 与 其 他 因素 之 间 的 关联 性 ,来 找 出 该 犯罪 的 相关 因素 ， 
如 地 理 位 置 特征 .受害 人 和 群 特征 等 ,并 采取 一 定 的 干预 措施 ,从 源头 上 减少 
该 类 案件 发 生 的 条 件 。 

在 美国 ,已 经 涌现 出 一 批 犯 罪 热 点 的 智能 分 析 工 具 。 上 文 提 到 的 1994 
年 美国 纽约 警方 研发 的 COMPSTAT(computer statistics) 便 是 典型 的 犯 
罪 热 点 分 析 系 统 , 其 在 犯罪 热点 分 析 的 历史 上 具有 里 程 碑 式 意义 。 在 当 
代 , 大 数据 技术 开始 逐渐 运用 至 犯罪 热点 分 析 、 预 测 工作 中 去 。 例 如 圣 塔 
克拉 拉 大 学 的 莫 勒 教授 (Professor Mohler of Santa Clara University ) 将 地 
震 学 原理 运用 至 犯罪 热点 预测 中 ,发 明了 一 种 “地 震 模 型 ”(earthquake 
modeling) 算 法 一 一 将 地 区 进行 网 格式 划分 ,每 当 一 个 地 区 有 新 的 犯罪 发 生 
后 ,系统 就 可 以 自动 计算 出 下 一 次 犯罪 发 生 的 概率 ,与 地 震 后 的 “余震 ” 计 
算 原 理 相似 。 这 种 预测 模型 对 于 财产 类 犯罪 和 枪支 类 犯罪 的 预测 有 着 很 
高 的 准确 率 ."1 孟菲斯 警方 开发 的 “ 蓝 色 风暴 ”(Blue Crush) 软件 、 


应 用 。 


[1] See Kelly K. Koss,“ Leveraging Predictive Policing Algorithms to Restore Fourth 
Amendment Protections in High-Crime Areas in a Post-Wardlow World”, Chicago Kent Law 


Review ,1(2015) ,pp。 301-334. 
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在 我 国 , 犯 罪 热 点 分 析 也 已 经 在 侦查 工作 中 开始 运用 。 例 如 北京 市 怀 
柔 区 公安 局 的 “犯罪 预测 时 空 定位 信息 管理 系统 ”(FZYC-1.0) 便 结合 了 犯 
罪 热点 分 析 和 犯罪 时 空 预 测 功 能 ( 见 图 5-31)。Q@ 犯 罪 热 点 分 析 功 能 。 该 
软件 能 够 对 怀柔 地 区 的 所 有 历史 案件 进行 大 数据 分 析 , 并 在 地 图 上 以 “ 热 
点 化 ”形象 所 呈现。 点 击 每 一 个 “热点 ”, 系统 就 会 显示 出 该 热点 地 区 的 具 
体 犯 罪 类 型 和 犯罪 数量 ,并 在 时 间 轴 上 显示 该 地 区 犯罪 活动 的 历史 发 展 趋 
势 。@ 犯 罪 时 空 预测 功能 。 犯 罪 预 测 主要 建立 在 对 历史 犯罪 规律 的 提炼 
上 ,将 规律 转化 为 数据 模型 并 运用 于 对 未 来 时 间 、 空 间 犯 罪 活动 的 预测 。 
该 系统 每 天 、 每 周 都 会 对 本 地 区 的 犯罪 趋势 进行 自动 预测 ,对 于 各 个 片区 
发 生 犯罪 的 不 同 概率 以 系数 进行 精确 化 表示 ,并 以 红 、 柳 、 黄 、 绿 、 蓝 五 种 颜 
色 代表 不 同 的 警 级 .1 还 有 的 互联 网 公司 ( 智 图 GeoQ) 开 发 出 “北京 治安 
地 图 ”的 手机 应 用 ,将 北京 市 各 种 类 、 各 地 区 的 犯罪 在 地 图 上 投射 出 来 ,其 
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图 5-31 北京 市 怀柔 区 公安 局 “犯罪 预测 时 空 定 位 信息 管理 系统 ” 


C1] 韶 耀 军 , 张 明 :《 犯 罪 预测 时 空 定位 管理 系统 的 构建 》, 载 (中 国人 民 公 安 大 学 学 报 光 社会 
科学 版 ) ,2013(4) 。 图 片 同样 来 源 于 此 文 。 
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图 5-32 ”北京 市 治安 地 图 517 





| 。 案件 类 型 
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第 七 节 大 数据 公司 调 取 数据 


51] 图 片 来 源 于 微 信和 应 用 。 


上 述 的 几 种 大 数据 侦查 方法 主要 是 从 技术 角度 进行 介绍 。 其 实 , 实 务 
中 还 有 一 种 大 数据 侦查 方法 容易 被 忽略 , 即 从 大 数据 公司 调 取 数据 。 这 里 
的 大 数据 公司 是 指 掌握 有 海量 个 人 数据 的 公司 、 企 业 , 它 们 多 为 大 型 互联 
网 公司 。 在 为 用 户 提 供 网 络 服务 的 同时 ,这 些 大 数据 公司 经 过 多 年 的 积 
累 , 也 收集 了 用 户 的 大 量 数据 。 在 我 国 , 大 数据 公司 的 典型 代表 有 百度 、 腾 
讯 , 阿 里 巴巴 等 ,百度 掌握 有 全 国 大 量 用 户 的 网 络 搜索 数据 ,腾讯 公司 掌握 
有 海量 的 用 户 社交 数据 ,阿里 巴巴 公司 则 掌握 着 用 户 的 交易 数据 。 

大 数据 时 代 , 数 据 主体 与 数据 持 有 者 往往 发 生 分 离 , 个 人 所 持 有 的 数 
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据 是 有 限 的 ,而 大 量 的 个 人 数据 都 由 大 数据 公司 所 掌控 。 在 这 一 趋势 下 ， 
持 有 海量 数据 的 大 数据 公司 便 逐 渐 成 为 犯罪 侦查 取证 的 重要 来 源 。 人 们 
越 来 越 多 的 日 常 行为 开启 了 ”互联 网 十 "模式 ,具有 ”一 次 行为 ,多 个 节点 ” 
的 特征 , 即 同 一 个 行为 不 仅 在 用 户 个 人 的 设备 终端 中 留 下 数据 记录 ,在 大 
数据 公司 的 服务 器 中 也 留 有 相关 数据 。 以 网 络 购物 为 例 , 网 购 记 录 不 仅 存 
在 当事人 的 手机 电脑 等 操作 设备 上 ,在 网 络 服务 商 的 服务 器 中 也 留存 有 
相应 的 数据 ;还 有 一 部 分 特殊 的 数据 只 有 网 络 服务 商 才 有 ,例如 用 户 的 
cookies 记录 。 相 比 于 用 户 所 拥有 的 零散 数据 ,这 些 大 数据 公司 由 于 技术 上 
的 优势 可 以 更 为 全 面 系 统 地 掌握 用 户 的 海量 数据 。7” 

那么 ,这 些 大 数据 公司 到 底 掌 握 有 哪些 个 人 数据 呢 ? 就 以 上 述 的 我 国 
三 大 互联 网 公司 为 例 , 它 们 所 获取 的 数据 具体 分 为 以 下 两 类 : 一 类 是 用 户 
所 提供 的 数据 。 包 括 用 户 的 个 人 身份 信息 ,如 姓名 ,年 龄 .地 址 .性 别 . 电 
话 ` 证 件 号 码 等 ;用 户 在 使 用 产品 或 服务 过 程 中 所 存储 、 提 供 的 信息 ,如 聊 
天 内 容 、 邮 件 内 容 、 私 信和 内容, 社交 空间 存储 ,发 布 的 照片 ,文字 等 内 容 。 另 
一 类 是 网 络 平台 服务 商 所 主动 获取 的 数据 。 具 体 有 日 志 数 据 , 即 用 户 在 浏 
览 网 站 过 程 中 被 抓 取 的 一 些 信息 ,如 搜索 记录 、IP 地 址 、 所 访问 服务 的 网 
页 ,设备 或 软件 的 类 型 ,使 用 的 语言 .访问 时 间 等 ;地 理 位 置 数据 ,如 在 移动 
终端 使 用 APP 时 被 获取 的 位 置信 息 ;通讯 信息 ,通讯 过 程 中 所 产生 的 账 
号 ,时 间 、 联 系 人 等 信息 ;其 他 元 数据 ,如 上 传 照 片 中 所 含有 的 日 期 \ 时 间 、 
地 址 等 信息 。?” 

目前 ,实务 中 越 来 越 多 的 司法 机 关 、 行 政 机 关 、 国 家 安全 机 关 等 开 
始 意识 到 大 数据 公司 的 数据 价值 ,并 纷纷 向 其 调 取 相关 数据 。 就 司法 
机 关 而 言 ,在 刑事 诉讼 中 , 调 取 数据 的 有 公安 机 关 、 人 民 检 察 院 和 人 民 
法 院 。 具 体 到 侦查 环节 ,侦查 人 员 向 大 数据 公司 调 取 数据 主要 有 以 下 


51] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 》,2015 
本 让 

52] 参考 百度 .腾讯 .阿里 巴巴 隐私 政策 中 所 提供 的 数据 内 容 。 王 燃 :《 大 数据 时 代 个 人 信息 
保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 ),2015(5) 。 
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两 种 形式 。"? 

一 是 个 案 侦查 中 的 数据 调 取 。2016 年 “两 高 一 部 ”出 台 的 (关于 办 理 刑 
事 案 件 收集 提取 和 审查 判断 电子 数据 若干 问题 的 规定 ) 第 3 条 明确 规定 了 
大 数据 公司 向 公检法 机 关 提 供 数据 的 义务 ;5? 愉 刑法 修正 案 ( 九 )》 中 新 增 了 
“ 拒 不 履行 信息 网 络 安全 管理 义务 罪 ”, 规 定 网 络 服务 提供 者 不 履行 法 定义 
务 ,致使 刑事 案件 证 据 灭失 ,情节 严重 的 , 则 有 可 能 会 接受 刑法 制裁 。 此 
外 ,以 下 原因 也 促使 了 大 数据 公司 的 数据 成 为 新 的 侦查 资源 : 四 诉讼 方便 
的 需求 。 在 有 些 案件 中 ,基于 案情 保密 的 需要 ,不 宜 直 接 通 过 数据 主体 取 
证 ,如 职务 犯罪 的 初 查 阶 段 基于 保密 需要 就 不 能 惊动 当事人 ;还 有 些 案件 
中 ,难以 联系 到 数据 主体 。 这 些 情况 下 掌握 同样 数据 的 大 数据 公司 就 成 为 
最 合适 的 取证 来 源 。@ 个 人 数据 丢失 。 有 些 情况 下 ,数据 主体 的 电子 设备 
或 网 络 中 的 相关 数据 已 经 被 删除 或 是 丢失 ,或 者 是 恢复 数据 需要 巨大 的 成 
本 。 此 时 大 数据 公司 也 是 合适 的 取证 来 源 。@ 证 据 印证 的 需求 。 证 据 印 
证 是 指 对 于 同一 待 证 事实 需要 有 两 个 及 两 个 以 上 的 证 据 予 以 证 明 , 孤 证 不 
能 定案 。 在 具体 的 个 案 中 ,电子 证 据 除 了 与 传统 证 据 相 印证 外 ,电子 证 据 
本 身 也 可 以 相互 印证 ,尤其 是 网 络 空间 的 电子 证 据 , 可 以 与 单机 中 的 电子 
证 据 形 成 多 重 节点 的 印证 。 例 如 A 发 给 B 的 一 份 电子 邮件 ,首先 在 A 和 B 
的 电脑 或 手机 等 终端 会 留 有 文本 或 是 相关 阅读 痕迹 ;其 次 这 封 邮 件 还 存在 
于 两 人 的 网 络 邮箱 中 ;最 后 在 网 络 邮 箱 服务 商 的 后 台数 据 中 也 有 记录 ,这 
些 节点 中 的 “邮件 ”可 以 形成 相互 印证 的 电子 证 据 体 系 。 因 而 ,有 时 基于 证 
据 印证 的 需求 ,也 需要 从 大 数据 公司 提取 数据 。5”” 


[C1] 参考 百度 .腾讯 .阿里 巴巴 隐私 政策 中 所 提供 的 数据 内 容 。 王 燃 :《 大 数据 时 代 个 人 信息 
保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 )》,2015(5) 。 

52] 《关于 办 理 刑事 案件 收集 提取 和 审查 判断 电子 数据 若干 问题 的 规定 》? 第 3 条 : 人 民法 院 、 
人 民 检 察 院 和 公安 机 关 有 权 依法 向 有 关 单 位 和 个 人 收集 . 调 取 电子 数据 。 有 关 单 位 和 个 人 应 当 如 
实 提供 。 

53] 《关于 办 理 刑事 案件 收集 提取 和 审查 判断 电子 数据 若干 问题 的 规定 } 第 3 条 : 人 民法 院 、 
人 民 检 察 院 和 公安 机 关 有 权 依 法 向 有 关 单 位 和 个 人 收集 、 调 取 电 子 数据 。 有 关 单 位 和 个 人 应 当 如 
实 提供 。 
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二 是 侦查 机 关 与 大 数据 公司 的 数据 共享 协作 。 司 法 机 关 与 大 数据 公 
司 开展 共享 协作 ,是 近年 来 非常 流行 的 司法 战略 模式 ,不 少 地 区 的 公 、 检 、 
法 机 关 开 始 与 大 数据 公司 开展 数据 共享 战略 。 司 法 机 关 通 过 利用 大 数据 
公司 数据 资源 .数据 分 析 技 术 ,来 推进 司法 工作 的 开展 。 侦 查 机 关 和 大 数 
据 公司 的 数据 在 共享 .融合 后 ,往往 会 发 生 “1 十 1 二 2? 的 化 学 反应 ,尤其 是 
对 于 犯罪 活动 的 预防 .打击 工作 能 起 到 巨大 的 作用 。 例 如 2013 年 12 月 , 深 
圳 市 公安 与 腾讯 公司 成 立 了 “天 下 无 贼 反 信息 诈骗 联盟 ”, 侦 查 人 员 识 别 了 
大 量 犯罪 行为 之 间 的 联系 .发现 了 大 量 犯 罪 活动 的 线索 ;通过 对 诈骗 分 子 
的 网 络 行为 .行踪 轨迹 、 消 费 数 据 等 的 重组 ,警方 还 实现 了 对 网 络 诈骗 行为 
的 实时 监测 .拦截 和 打击 .513 再 如 2016 年 2 月 ,南京 市 公安 与 腾讯 公司 展 
开 合 作 ,为 秦淮 灯会 提供 安全 保障 。 南 京 市 公安 利用 腾讯 的 热力 地 图 , 结 
合 该 市 历史 同期 人 流 数 据 , 准确 预测 了 2016 年 秦淮 灯会 期 间 市 区 人 流 的 
分 布 特征 ,为 勤务 指挥 、 现 场 调度 提供 依据 .52” 


第 八 节 本 童 结论 


本 章 主要 从 技术 角度 介绍 了 大 数据 侦查 中 的 常用 方法 ,主要 包括 数据 
搜索 .数据 碰撞 、 数 据 挖掘 .数据 画像 .犯罪 网 络 分 析 , 这 几 种 方法 也 有 着 各 
自 的 特征 。 首 先 ,方法 的 难 易 程度 各 不 相同 。 数 据 搜索 和 数据 碰撞 两 种 方 
式 相对 简单 ,因而 这 两 种 方式 在 侦查 实务 中 运用 也 比较 广泛 ,技术 也 相对 
成 熟 。 而 数据 挖掘 、 数 据 画 像 以 及 犯罪 网 络 分 析 这 几 种 方法 主要 是 随 着 大 
数据 时 代 的 到 来 而 进入 人 们 的 视野 ,在 侦查 实务 中 的 运用 尚未 完全 成 熟 ， 
但 随 着 大 数据 技术 的 发 展 ,它们 也 必 将 拥有 广泛 的 应 用 前 景 。 其 次 ,各 方 
法 的 功能 、 作 用 不 同 。 数 据 搜索 、 数 据 磁 撞 主要 是 为 了 从 海量 的 数据 中 去 


51] 《深圳 打造 智慧 城市 打击 信息 诈骗 看 好 腾讯 大 数据 ), 载 南方 网 http://www. cww. net. 
cn/UC/html/2015/6/18/20156181548289083. htm, 最 后 访问 时 间 : 2016 年 9 月 29 日。 

52] 腾讯 研究 院 :《 南 京 市 公安 局 与 企鹅 合体 ,用 的 是 什么 “姿势 ")( 非 出 版 物 ),2016 年 9 月 
30 日 。 
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寻找 与 案件 相关 的 数据 ,正如 大 数据 领域 一 个 非常 著名 的 比喻 “从 干草 堆 
中 寻找 一 根 有 用 的 针 ”。 在 这 一 过 程 中 大 数据 方法 仅仅 是 起 到 媒介 、 方 法 
的 作用 ,所 获取 的 数据 结果 仍然 是 数据 的 原本 样 态 。 而 数据 挖掘 ,数据 画 
像 及 犯罪 网 络 分 析 的 主要 任务 则 并 非 是 从 海量 数据 中 去 寻找 某 个 数据 ,而 
是 以 海量 数据 为 基础 进行 二 次 分 析 , 所 获取 的 结果 已 经 不 再 是 数据 原本 的 
样 态 , 而 是 对 数据 背后 规律 的 挖掘 ,如 人 的 行为 轨迹 、 兴 趣 爱 好 、 人 物 特点 、 
人 物 关 系 等 ,能 够 为 犯罪 侦查 提供 更 有 价值 .更 深层 次 的 信息 。 另 外 ,在 大 
数据 时 代 , 侦 查 机 关 不 能 忽略 大 数据 公司 的 重要 作用 ,无 论 是 个 案 侦查 中 
去 大 数据 公司 调 取 数据 ,还 是 与 大 数据 公司 开展 数据 共享 合作 ,其 海量 的 
数据 源 .成 熟 的 数据 挖掘 技术 ,都 能 够 为 侦查 机 关 预 防 .打击 犯罪 提供 有 力 
的 帮助 。 

在 具体 的 犯罪 侦查 过 程 中 ,侦查 人 员 要 根据 案件 情况 和 侦查 资源 去 选 
择 合适 的 大 数据 方法 ,也 可 以 综合 运用 多 种 方法 。 一 般 在 案件 侦查 初期 ， 
知道 嫌疑 人 的 基本 身份 信息 后 ,可 以 利用 侦查 机 关 数据 库 以 及 社会 数据 
库 , 对 其 进行 基本 的 数据 画像 ;在 掌握 基本 信息 之 后 ,侦查 人 员 可 以 采取 数 
据 碰 撞 技术 去 获取 案件 相关 时 间 、 地 点 、 轨 迹 、 人 物 等 信息 ;如 果 能 够 获取 
嫌疑 人 话 单 或 者 是 手机 、 电 脑 数 据 , 侦 查 人 员 则 可 以 借助 分 析 软 件 进 行 大 
数据 挖掘 ,获取 有 关 其 行为 规律 .兴趣 爱好 等 深层 次 信息 。 另 外 , 当 侦 查 机 
关 所 获取 的 数据 资源 ,数据 技术 有 限时 ,不 要 忘记 向 大 数据 公司 寻求 帮助 。 

不 过 ,任何 一 种 新 的 技术 在 进入 人 们 生活 后 ,往往 都 会 带 来 新 的 法 律 
问题 。 大 数据 技术 在 带 来 侦查 方法 革新 .促进 侦查 效率 提高 的 同时 ,同样 
也 会 产生 新 的 法 律 问题 。 大 数据 侦查 对 诞生 于 小 数据 时 代 的 传统 侦查 程 
序 、 权 利 等 会 带 来 一 定 的 影响 和 冲击 ,如 何 去 发 现 并 回应 这 些 问 题 将 在 下 


一 章节 讨论 。 
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大 数据 作为 新 的 技术 ,对 传统 侦查 在 思维 、 模 式 、 方 法 等 各 方面 都 带 来 
了 变革 ,为 侦查 领域 注入 了 新 的 血液 。 但 是 ,在 大 数据 侦查 技术 发 展 的 过 
程 中 ,如 果 不 加 以 规制 ,也 会 带 来 一 系列 问题 ,例如 大 数据 挖掘 对 个 人 信息 
权 的 侵犯 ,大 数据 技术 对 正当 程序 的 冲击 等 。 另 外 ,目前 我 国 的 大 数据 侦 
查 配 套 机 制 还 很 不 健全 ,数据 壁垒 现象 仍然 严重 ,相关 技术 设施 尚 不 到 位 ， 
大 数据 公司 的 地 位 及 权利 义务 应 当 如 何 分 配 也 尚 不 明朗 。 本 章 拟 从 实体 
权利 保障 、 程 序 权 利 规制 及 配套 机 制 的 角度 ,对 上 述 问题 作出 回应 。 
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但 凡 提 到 大 数据 ,都 避 不 开 隐 私 权 的 问题 。 大 数据 在 为 人 类 带 来 新 的 
生产 资源 和 生产 力 的 同时 ,也 对 个 人 隐私 权 带 来 前 所 未 有 的 危机 ,甚至 有 
“大 数据 时 代 无 隐私 ”的 论断 。 不 过 ,诞生 于 小 数据 时 代 的 个 人 隐私 权 在 大 
数据 时 代 逐 浙 有 了 新 的 权利 内 容 , 传 统 的 隐私 权 内 涵 无 法 承载 这 些 新 变 
化 ,个 人 信息 权 应 运 而 生 。"1 本 节 就 个 人 信息 权 的 角度 出 发 ,探讨 大 数据 
侦查 与 个 人 信息 权 之 间 的 冲突 ,以 及 如 何 去 协 调 二 者 之 间 的 关系 。 


一 、 大 数据 侦查 对 个 人 信息 权 的 冲击 
随 着 大 数据 技术 在 侦查 领域 的 运用 ,我 们 往往 会 产生 这 样 一 种 担忧: 


51] 也 有 很 多 文章 是 探讨 大 数据 与 隐私 权 之 间 的 关系 ,本 文莉 酌 后 还 是 从 个 人 信息 权 的 角 
度 去 分 析 二 者 的 关系 。 隐 私 权 与 个 人 信息 权 之 间 固 然 有 交叉 重合 之 处 ,但 是 笔者 认为 传统 的 隐私 
权 在 大 数据 时 代 已 经 有 了 新 的 变化 及 范畴 ,而 传统 的 隐私 权 内 涵 无 法 承载 这 些 新 变化 ,因而 选用 
“个 人 信息 权 ” 更 为 合适 。 
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我 们 有 多 少 个 人 数据 掌握 在 侦查 机 关 手 中 ? 我们 的 一 言 一 行 是 否 时 刻 都 
被 监控 ? 我 们 电脑 .手机 中 的 数据 日 后 是 否 都 可 能 成 为 潜在 的 “犯罪 证 
据 ?? 在 大 数据 时 代 , 犯 罪 侦查 对 我 们 个 人 数据 “入 侵 ” 的 界限 何在 呢 ? 带 
着 这 些 疑 问 ,本 节 来 探讨 大 数据 侦查 与 个 人 信息 保护 之 间 的 利益 博弈 。 

(一 ) 法 理 视 角 : 大 数据 侦查 与 个 人 信息 权 的 博弈 

1. 个 人 信息 权 概 述 

个 人 信息 最 早 是 通过 隐私 权 来 保护 的 。 在 前 信息 化 时 代 , 个 人 数据 的 
量 还 不 多 ,价值 也 还 未 体现 ,对 信息 的 传播 范围 .传播 速度 都 是 有 限 的 , 因 
而 往往 将 其 纳入 隐私 保护 的 范畴 ,个 人 信息 权 的 概念 并 未 成 形 。 随 着 信息 
化 时 代 、 大 数据 时 代 的 到 来 ,个 人 信息 所 承载 的 功能 和 价值 日 益 凸 显 ,即使 
是 扩张 解释 的 隐私 权 也 已 经 不 足以 涵盖 个 人 信息 的 范围 了 。 概 言 之 ,隐私 
权 是 对 物理 空间 中 人 们 口 耳 相传 能 力 的 限制 ,而 对 于 网 络 时 代 信息 传播 的 
范围 和 速度 ,隐私 权 的 对 抗 能 力 则 捉襟见肘 ,"22 个 人 信息 权 的 独立 价值 逐 
渐 开 始 体现 。 很 多 国家 已 将 个 人 信息 权 作为 独立 的 权利 予以 规制 ,例如 德 
国 在 1983 年 提出 了 “信息 的 个 人 自决 权 ” 概 念 ,美国 学 者 提出 了 “数字 化 人 
格 ” 的 概念 52 个 人 信息 保护 的 法 律 框架 也 开始 建立 ,如 欧盟 自 20 世纪 
90 年 代 以 来 出 台 了 《个 人 数据 保护 指令 》(1995 年 )《 隐 私 与 电子 通信 指 
令 》(1997 年 )《 数 据 留存 指令 》(2006 年 ) 《一 般 数 据 保护 指令 》(2012) 等 
一 系列 针对 个 人 信息 的 专门 法 规 ; 美 国 则 是 将 个 人 信息 的 保护 分 散 到 各 个 
行业 法 当中 ,如 《网 上 儿童 隐私 保护 法 兴 电 子 交 流 隐私 法 兴 计 算 机 欺诈 与 
滥用 法 兴 家 庭 教 育 和 隐私 法 》 等 单行 法 ;5?) 日 本 在 2003 年 5 月 出 台 了 《个 
人 信息 保护 法 》,5422015 年 9 月 3 日 又 对 (个 人 信息 保护 法 》 进 行 了 全 面 的 
修订 .5 


5C1] 汤 强 :《 信 息 化 背景 下 侦查 权能 的 扩张 与 转型 ), 载 ( 净 月 学 刊 ),2014(2) 。 

52] 郭 瑜 :《 个 人 数据 保护 法 研究 ),87 一 88 页 ,北京 ,北京 大 学 出 版 社 ,2012。 

53] 廉 震 :《 从 民法 视角 看 隐私 与 个 人 信息 保护 的 制度 安排 ), 载 (黑龙 江 省 政法 管理 干部 学 
院 学 报 》,2010(8) 。 

54] 李 丹 丹 :《 日 本 个 人 信息 保护 举措 及 启示 》, 载 (人 民 论坛 》,2015(4) 。 

55] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015(5) 。 
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个 人 信息 是 指 任何 能 够 识别 出 自然 人 的 信息 , 既 包括 直接 信息 ,也 包 
括 间接 信息 .1 一 般 来 说 ,能 够 直接 识别 自然 人 的 信息 包括 姓名 、 身 份 证 
号 .电话 号 码 、 护 照 号 码 、 指 纹 .DNA 数据 等 ;除了 直接 识别 自然 人 的 数据 
外 ,一 些 看 似 与 自然 人 无 关 的 数据 在 特定 情境 下 也 能 够 指向 具体 个 人 。 尤 
其 是 在 大 数据 时 代 , 即 便 是 去 除 个 人 身份 信息 的 匿名 数据 ,通过 数据 挖掘 
技术 ,最 终 仍然 能 够 指向 具体 的 个 人 。 关 于 个 人 信息 的 概念 ,还 有 几 个 问 
题 需要 厘清 。5 2” 

一 是 个 人 信息 与 个 人 数据 之 区 分 。 有 学 者 曾经 对 个 人 信息 与 个 人 数 
据 进行 过 区 分 ,认为 信息 是 指 加 工 过 的 数据 ,个 人 信息 比 个 人 数据 涵盖 的 
范围 要 广 .5 ?1 笔者 认为 ,无 论 是 “个 人 信息 ?还 是 “个 人 数据 ?都 只 是 称呼 上 
的 差别 ,有 些 国家 习惯 于 使 用 “个 人 数据 "(欧盟 ), 有 些 国 家 习惯 使 用 “个 人 
信息 ”中国 、 日 本 、 韩 国 、 俄 罗斯 等 国 ), 还 有 些 国家 习惯 于 将 个 人 信息 纳入 
隐私 保护 范畴 (美国 .澳大利亚 、 加 拿 大 等 国 ) ,我 国 台湾 地 区 则 称 之 为 “个 
人 资料 ”。 从 字面 意思 严格 讲 , 个 人 信息 与 个 人 数据 确实 有 差异 ,但 就 其 所 
包含 的 客体 、 权 益 等 实质 内 容 来 看 ,二 者 应 当 是 同一 意思 。 名 称 的 不 同 与 
各 国 的 语言 习惯 及 法 律 背景 有 关 , 如 美国 之 所 以 用 隐私 权 来 保护 个 人 隐 
私 , 是 因为 其 本 身 隐私 权 的 范围 就 很 广 ."，? 在 本 文中 ,个 人 信息 与 个 人 数 
据 具有 同样 的 内 涵 , 不 加 以 区 分 。 

二 是 个 人 信息 权 与 隐私 权 之 区 分 。 尽 管 早期 个 人 信息 是 通过 隐私 权 
来 保护 的 ,但 是 个 人 信息 权 与 隐私 权 是 两 种 不 同类 型 的 权利 体系 ,在 信息 
化 时 代 个 人 信息 权 具 有 完全 独立 的 内 涵 。 个 人 信息 是 指 任何 能 够 识别 出 
自然 人 的 直接 或 间接 信息 ,而 隐私 权 则 强调 公民 的 私人 生活 不 被 干扰 ,个 


C1) 石 佳 友 :《 网 络 环境 下 的 个 人 信息 保护 立法 》, 载 (苏州 大 学 学 报 》,2012(6) 。 

52] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学报 》,2015(5) 。 

53] 梅 绍 祖 :《 个 人 信息 保护 的 基础 性 问题 研究 ), 载 (苏州 大 学 学 报 )( 哲 学 社会 科学 版 )， 
2005(2) 。 

54] 王利明 :《 个 人 信息 权 的 法 律 保护 一 一 以 个 人 信息 权 与 隐私 权 分 界 为 中 心 ), 载 (现代 法 
学 》,2013(7)。 

55] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015(5)。 
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人 秘密 不 被 非法 收集 和 传播 :52 个 人 信息 中 有 相当 一 部 分 是 公开 的 信息 ， 
不 涉及 个 人 隐私 ,而 个 人 隐私 除了 以 信息 形式 表现 之 外 ,还 包括 生活 安宁 
和 生活 秘密 领域 ;隐私 权 主 要 是 一 种 消极 的 、 防 御 性 .静态 的 权利 ,而 个 人 
信息 权 主 要 是 一 种 积极 的 ,控制 性 ,动态 的 权利 ,强调 对 个 人 信息 的 利用 及 
控制 ;此 外 ,二 者 在 权利 客体 、 权 利 内 容 等 方面 都 有 不 同 之 处 。 不 过 二 者 之 
间 也 有 很 多 交错 重合 之 处 ,个 人 信息 中 相当 一 部 分 会 涉及 个 人 隐私 ,而 个 
人 隐私 中 也 有 相当 一 部 分 是 以 信息 形式 所 呈现 的 。522 

2. 个 人 信息 法 律 保护 的 真空 地 带 

目前 ,我 国 侦查 领域 的 个 人 信息 保护 尚 处 于 法 律 真空 状态 。 一 方面 ， 
个 人 信息 保护 本 身 的 法 律 体系 尚 不 完善 。 另 一 方面 ,刑事 诉讼 法 体系 中 没 
有 涉及 个 人 信息 保护 的 内 容 。 这 种 “两 不 管 ” 的 状态 ,造成 了 侦查 领域 个 人 
信息 保护 缺失 的 法 律 现象 。 

(1) 个 人 信息 保护 法 的 缺 位 。 长 久 以 来 ,我 国 一 直 没 有 专门 的 个 人 信 
息 保护 法 ,实务 中 车 有 此 类 案例 也 往往 将 其 纳入 隐私 权 的 保护 领域 ."37 目 
前 有 关 个 人 信息 保护 的 法 律 大 都 零散 分 布 在 一 些 部 门 法 的 条 款 中 ,如 《 民 
法 通则 兴 刑 法 兴 邮 政法 兴 刑 法 修正 案 ( 七 ) 兴 刑法 修正 案 ( 九 )》 等 。 有 学 者 
统计 ,我 国共 有 100 多 部 有 关 个 人 信息 保护 的 法 律 法 规 , 涉 及 金融 .医疗 、 
网 络 等 近 二 十 个 领域 .4 近年 来 ,尽管 也 出 现 了 一 些 与 个 人 信息 有 关 的 法 
律 文件 ,但 大 都 处 于 较 低 的 法 律 位 阶 , 如 2012 年 颁布 的 (全 国人 大 关于 加 
强 网 络 信息 保护 的 决定 》,2013 年 国家 标 委 会 颁布 的 (信息 安全 技术 公用 及 
商用 服务 信息 系统 个 人 信息 保护 指南 》，2013 年 工信部 颁布 了 (电信 和 互联 
网 用 户 个 人 信息 保护 规定 》,2014 年 中 国 科 学 技术 法 学 会 和 北京 大 学 互联 网 
法 律 中 心 颁布 了 《互联 网 企业 个 人 信息 保护 测评 标准 》。 这 些 法 律 法 规 及 指 


51] 王利明 :《 隐 私 权 概念 的 再 界定 ), 载 (法 学 家 》,2012(1)。 

52] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 》,2015(5) 。 

53] 我 国 的 “cookies 第 一 案 ” ,北京 百度 网 讯 科技 公司 与 朱 烨 隐私 权 纠 纷 案 ,(2014) 宁 民 终 字 
第 5028 号 。 

C4] 安 小 米 等 :《 我 国 涉及 隐私 的 个 人 信息 保护 与 管理 法 律 法 规 状况 及 要 求 分析 》, 载 (北京 
档案 》,2011(5) 。 
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导 性 文件 构成 了 我 国 目前 个 人 信息 保护 的 法 律 体系 ,但 仍 不 足以 构建 起 个 人 
信息 保护 的 基本 法 律 制度 , 仅 有 的 几 部 专门 性 法 规 效力 也 都 不 高 "7 

(2) 刑事 诉讼 法 领域 对 个 人 信息 保护 的 缺 位 。 现 行刑 事 诉 讼 法 中 构建 
于 前 信息 化 时 代 , 其 主要 适用 场 域 是 现实 的 物理 空间 ,所 关注 的 权利 主要 
还 停留 在 人 身 权 、 财 产权 以 及 自由 权 等 权利 ,相关 的 侦查 程序 规制 主要 也 
是 针对 上 述 权 利 的 保护 ."?? 刑事 诉讼 法 对 产生 于 互联 网 时 代 、 大 数据 时 代 
的 个 人 信息 权 的 关注 还 处 于 缺失 状态 ,即使 有 个 别 相关 规定 ,主要 也 还 停 
留 在 隐私 权 的 层面 。 并 且 大 多 数 规则 是 要 求 侦查 人 员 对 所 获取 的 个 人 信 
息 保 密 ,而 并 没有 从 侦查 行为 本 身 去 规制 对 个 人 信息 的 处 理 。 例 如 《刑事 
诉讼 法 ) 第 52 条 第 3 款 规 定 对 涉及 个 人 隐私 的 证 据 应 当 保密 ,第 150 条 第 
2 款 也 有 类 似 规定 。 总 之 ,目前 我 国 刑事 诉讼 法 体系 尚 还 未 构建 起 信息 领 
域 的 适用 规则 ,加 之 传统 规则 在 信息 空间 的 不 适应 性 ,造成 了 个 人 信息 保 
护 与 大 数据 侦查 之 间 严 重 脱节 的 现象 。 

在 个 人 信息 保护 的 法 律 体系 中 ,涉及 的 主体 有 个 人 信息 主体 、 个 人 信 
息 管理 者 以 及 个 人 信息 处 理 者 。 个 人 信息 管理 者 是 个 人 信息 保护 体系 中 
最 为 关键 的 角色 ,其 掌握 着 大 量 的 个 人 数据 ,并 决定 个 人 数据 的 加 工 、 分 
析 ` 流 转 等 具体 处 理 方式 ;同时 ,个 人 信息 管理 者 也 承担 最 主要 的 个 人 信息 
保护 义务 。 当 侦查 机 关 展 开 大 数据 侦查 时 ,必然 要 对 个 人 信息 进行 加 工 、 
处 理 , 理 所 当然 地 成 为 “个 人 信息 管理 者 ”。 但 是 , 相 比 于 一 般 的 个 人 信息 
管理 者 而 言 ,侦查 机 关 基 于 国家 公 权 力 职能 行使 的 需要 ,享有 一 定 的 潞 免 
权 , 这 在 我 国 现 有 的 有 关 个 人 信息 保护 的 法 律 法 规 中 都 有 所 体现 ."? 

然而 , 蔬 免 .例外 并 非 是 没有 边界 的 ,侦查 机 关 对 个 人 信息 的 收集 利用 





ma 


51] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 》,2015(5) 。 

52] 《刑事 诉讼 法 ?第 2 条 中 将 * 其 他 权利 ”作为 掀 底 条 款 , 理 应 包括 个 人 信息 权 。 

53] 例如 我 国 (互联 网 电子 邮件 服务 管理 办 法 ) 第 2 条 、 第 10 条 的 规定 。 再 如 2013 年 (信息 
安全 技术 公用 及 商用 服务 信息 系统 个 人 信息 保护 指南 ) 中 一 开始 就 将 其 适用 范围 排除 了 政府 机 关 
等 机 构 。2014 年 中 国 科学 技术 法 学 会 和 北京 大 学 互联 网 法 律 中 心 颁布 的 (互联 网 企业 个 人 信息 保 
护 测 评 标准 ) 中 多 次 将 维护 公共 安全 、 紧 急 避 险 , 行 政 机 关 依 据 法 律 作出 的 强制 行为 ,司法 机 关 依 据 
法 律 作出 的 决定 .裁定 或 判决 等 情形 排除 在 适用 范围 之 外 。 
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与 个 人 信息 保护 的 界限 到 底 在 哪里 ?对 此 ,我 国 个 人 信息 保护 法 领域 和 刑 
事 诉 讼 法 领域 都 没有 明确 的 规定 。 法 律 中 的 真空 地 带 无 形 中 为 侦查 权 的 
行使 留 下 了 非常 大 的 空间 ,在 侦查 中 个 人 信息 面临 着 没有 保护 的 “裸奔 ” 风 
险 。 实 际 上 ,个 人 信息 保护 法 诞生 的 初衷 就 是 为 了 规范 政府 的 数据 处 理 行 
为 ,如 美国 1974 年 的 (隐私 法 案 》、 联 邦 德国 1977 年 的 (个 人 数据 保护 法 》， 
最 早 都 是 针对 政府 行为 的 。2016 年 欧盟 新 出 台 的 《 涉 警 务 司 法 目的 数据 交 
换 指令 ) 还 专门 对 刑事 司法 中 的 数据 处 理 进行 了 规制 ,强调 对 犯罪 嫌疑 人 、 
证 人 等 个 人 信息 权 的 保护 。 从 法 理 上 来 说 ,尽管 基于 司法 职能 ,行政 职能 
的 需求 ,政府 部 门 . 司 法 机 关 可 以 在 个 人 信息 保护 中 享有 和 浴 免 权 , 但 是 并 非 
没有 界限 ;更 何况 , 相 比 于 私人 机 构 而 言 ,政府 部 门 、 司 法 机 关 往 往 掌 握 有 
更 多 、 更 重要 的 个 人 信息 ,对 数据 的 处 理 动 辆 涉及 公民 的 人 身 权 、 自 由 权 等 
重要 权利 ,一 旦 出 现 数据 泄露 或 数据 错误 等 情况 则 会 造成 严重 后 果 。 因 
此 ,即使 公 、 检 法 等 公 权 力 机 关 在 作为 个 人 信息 管理 者 时 可 以 享有 一 定 的 
例外 权限 ,但 是 仍然 应 当 遵守 最 基本 的 个 人 信息 保护 要 求 。 

3. 大 数据 侦查 与 个 人 信息 保护 的 利益 博弈 

在 大 数据 时 代 , 个 人 信息 利用 与 个 人 信息 保护 之 间 是 一 对 永恒 的 矛 
盾 。 个 人 信息 本 身 所 承载 的 各 种 价值 使 之 成 为 各 方 主体 争夺 的 对 象 ,进而 
也 造成 了 多 头 利益 的 冲突 。 对 于 个 人 而 言 , 个 人 信息 是 数据 主体 人 格 权 的 
延伸 ,个 人 信息 中 包含 着 姓名 、 隐 私 、 肖 像 等 信息 ,需要 对 个 人 信息 权 进 行 
保护 ;对 于 商业 机 构 和 政府 部 门 而 言 ,个 人 信息 体现 出 如 石油 般 巨 大 的 经 
济 价值 .公共 管理 价值 ,成 为 提高 商业 利益 和 政府 管理 水 平 不 可 或 缺 的 资 
源 。 在 这 样 的 时 代 背 景 下 ,公民 个 人 对 于 个 人 信息 保护 的 诉求 与 商业 机 
构 政府 部 门 对 个 人 信息 的 利用 之 间 就 形成 了 矛盾 .5 

在 大 数据 侦查 领域 ,同样 存在 着 个 人 信息 保护 与 个 人 信息 利用 之 间 的 
矛盾 。 一 方面 ,侦查 机 关 基 于 行使 打击 犯罪 .维护 社会 秩序 的 公 权 力 职能 ， 
需要 利用 个 人 信息 的 侦查 价值 ,包括 建立 海量 的 个 人 信息 库 以 及 对 个 人 信 


51] 张 新 宝 :《 从 隐私 到 个 人 信息 : 利益 再 衡量 的 理论 与 制度 安排 ), 载 (中 国法 学 ),2015(3) 。 
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息 的 分 析 、 挖 掘 等 措施 ; 另 一 方面 ,个 人 信息 体现 着 人 格 尊严 等 基本 人 权 ， 
当事人 (数据 主体 ) 对 于 个 人 信息 本 身 就 有 诉 诸 保护 的 利益 。 尽 管 基 于 国 
家 打击 犯罪 利益 的 需求 ,个 人 信息 权 可 以 进行 一 定 的 让 步 , 但 这 种 让 步 也 
并 非 是 无 限度 的 。 因 此 ,就 形成 了 个 人 信息 保护 和 侦查 机 关 对 个 人 信息 利 
用 之 间 的 张力 。 进 一 步 说 ,在 侦查 的 语 境 下 ,这 对 张力 可 以 追溯 到 传统 侦 
查 中 打击 犯罪 与 保障 人 权 之 间 的 矛盾 。 在 大 数据 侦查 中 ,对 个 人 信息 利用 
的 上 位 利益 正 是 国家 打击 犯罪 的 需求 ,而 个 人 信息 保护 的 上 位 利益 恰好 又 
是 公民 的 基本 人 权 。 因 而 也 可 以 说 ,大 数据 侦查 中 的 个 人 信息 利用 与 保护 
之 间 的 矛盾 ,本 质 上 也 是 打击 犯罪 与 保障 人 权 了 矛盾 在 大 数据 时 代 的 具体 体 
现 。 然 而 , 相 比 于 一 般 领 域 的 个 人 信息 利用 与 个 人 信息 保护 之 间 的 矛盾 ， 
在 大 数据 侦查 领域 中 ,这 对 矛盾 更 具有 特殊 性 ,协调 起 来 也 更 加 困难 。 目 
前 ,鉴于 打击 犯罪 维护 社会 秩序 的 侦查 权能 的 需要 ,笔者 认为 ,个 人 信息 
权 的 保护 应 当做 出 一 定 让 步 ,权利 的 天 平 要 更 倾向 于 个 人 信息 利用 这 
ne 
打击 犯罪 vs. 保障 人 权 
t + 
个 人 信息 利用 vs. 个 人 信息 保护 


(二 ) 实务 视角 : 大 数据 侦查 对 个 人 信息 权 的 侵犯 

上 文 从 法 理 的 角度 分 析 了 大 数据 侦查 中 个 人 信息 利用 与 个 人 信息 保 
护 之 间 的 利益 博弈 ,这 对 矛盾 同样 体现 在 侦查 实务 中 。 侦 查 机 关 在 数据 收 
集 ,数据 分 析 过 程 中 , 均 存 在 着 侵害 个 人 信息 权 的 风险 。 

1. 大 数据 "监控 ” 

在 大 数据 时 代 , 我们 的 社会 正在 发 展 成 为 一 个 “大 数据 监控 社会 ” 
《bigdata surveillance) ,在 大 数据 技术 面前 我 们 正成 为 一 个 个 透明 的 人 : 我 
们 平时 在 公共 场所 的 行动 都 被 数 以 万 计 的 监控 视频 记录 下 来 ,我 们 的 乘 车 
出 行 信息 .旅馆 住宿 信息 存储 在 数据 库 中 ,通讯 信息 存储 在 运营 商 服务 器 
中 ,网 络 空间 社交 、 购 物 、 消 费 等 一 言 一 行 都 被 网 站 后 台所 记录 ,等 等 。 更 
令 人 担忧 的 是 ,这 些 海量 的 个 人 数据 都 有 可 能 成 为 犯罪 侦查 的 潜在 资源 。 
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具体 而 言 ,大 数据 监控 包括 国家 大 数据 监控 和 大 数据 公司 监控 两 大 类 型 。 

(1) 国家 大 数据 监控 。 在 大 数据 时 代 , 越 来 越 多 的 国家 开始 致力 于 收 
集 公民 的 个 人 信息 ,建立 海量 的 公民 信息 库 , 甚 至 建立 所 谓 的 国家 大 数据 
中 心 。 国 家 大 数据 监控 的 典型 代表 莫 过 于 美国 ,美国 在 20 世纪 60 年 代 就 
提出 过 要 建立 “中 央 数 据 银 行 ”, 建 立 全 国 所 有 公民 的 数据 档案 ;2002 年 又 
提出 建立 “万 维 信 息 触角 计划 ”, 企 图 搜集 公民 海量 的 数据 并 进行 数据 挖 
掘 ,所 幸 的 是 这 两 个 计划 都 未 实行 。 在 “9。11? 事 件 之 后 ,美国 启动 了 “元 
数据 ?项 目 , 美 国 国家 安全 局 (NSA) 采 集 互 联网 中 的 元 数据 ,对 象 涉 及 美国 
及 境外 公民 ,几乎 记录 了 世界 所 有 网 民 的 网 络 足迹 。2004 年 ,美国 国家 安 
全 局 (NSA) 还 发 起 过 名 为 “ 星 风 计划 ?的 项 目 ,棱镜 计划 就 是 其 下 的 子 项 目 
之 一 ,"1 美国 的 大 数据 监控 项 目 得 到 了 很 多 私人 企业 、 公 司 的 帮助 ,通过 
它们 的 服务 器 和 路 由 器 ,美国 政府 可 以 对 任何 数据 进行 监控 。 正 如 NSA 
首长 General Keith Alexander 所 说 ,为 了 在 干草 堆 中 找到 针 , 就 需要 拥有 
所 有 的 干草 ."?? 日 本 政府 的 大 数据 监控 来 源 于 其 “共同 番号 制度 ”。 日 本 
政府 在 2015 年 实行 了 “共同 番号 ”制度 (My Number) ,政府 分 配给 每 位 公 
民 一 个 独一无二 的 12 位 数 号 码 ,并 通过 这 个 号 码 去 收集 相关 个 人 信息 。 
养老 、 医 疗 \ 保 险 等 涉及 民生 的 六 个 领域 都 统一 使 用 同一 账号 ,在 未 来 个 人 
番号 还 将 与 银行 账号 、 信 用 积分 等 信息 挂 钧 "这 一 制度 已 经 引起 了 日 本 
国民 的 担忧 。 

实际 上 ,我 国 侦查 机 关 所 建立 的 各 大 数据 库 .数据 平台 , 某 种 程度 上 也 
可 以 说 是 一 种 大 数据 监控 。2003 年 我 国 启 动 了 “金盾 工程 ”任务 ,公安 系统 
建立 了 全 国人 口 基本 信息 资源 库 、 全 国 机 动车 与 驾驶 人 信息 资源 库 等 八大 
基础 信息 库 , 掌 握 全 国 公民 的 重点 信息 。 不 同 地 区 的 公安 机 关 也 在 建立 自 
有 的 信息 数据 库 , 如 一 般 各 个 地 区 的 公安 机 关 都 会 建立 DNA 数据 库 、 暂 住 


51] 李 军 :《 大 数据 一 一 从 海量 到 精准 》,131 一 137 页 ,北京 ,清华 大 学 出 版 社 ,2014。 

[2] See Miller, Kevin, “Total Surveillance, Big Data, and Predictive Crime Technology: 
Privacy’s Perfect Storm”, Journal of Technology Law & Policy ,1 (2014) ,pp. 105-146. 

C3] 孙 晓 柳 :《 日 本 (番号 法 ) 探 究 ), 载 (长 春 理工 大 学 学 报 》,2014(8)。 
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人 员 信 息 库 .旅馆 住宿 人 员 信 息 库 \、 车 辆 违章 信息 库 、 网 吧 上 网 人 员 信 息 
库 、 枪 支管 理 信息 库 等 ,从 而 保证 对 全 国 重点 人 、 物 及 场所 的 管控 。 司 法 实 
务 中 ,侦查 机 关 开 始 出 现 将 各 个 数据 库 进 行 串 并 、 综 合 运用 的 做 法 ,如 某 市 
公安 局 建立 了 “ 防 控 一 体 化 ”大 平台 ,实现 一 键 式 查询 ,通过 系统 平台 便 可 
以 快速 获取 某 个 人 的 全 面 信息 。 

(2) 大 数据 公司 的 大 数据 监控 。 实 际 上 ,大 数据 公司 对 于 公民 数据 的 
监控 并 不 亚 于 政府 部 门 、 司 法 机 关 , 它 们 同样 会 成 为 大 数据 侦查 的 数据 来 
源 ,甚至 大 数据 公司 所 采集 的 个 人 数据 比 侦查 机 关 的 数据 更 具有 私密 性 和 
及 时 性 。 网 络 公司 在 提供 服务 的 同时 ,会 对 用 户 的 个 人 身份 信息 、 行 为 轨 
迹 、 交 易 情 况 、 聊 天 内 容 等 都 进行 了 记录 与 保存 ."' ” 随 着 大 数据 的 发 展 ,还 
出 现 了 专门 的 大 数据 交易 所 甚至 是 数据 交易 商务 平台 ,如 贵阳 大 数据 交易 
中 心 .长 江 大 数据 交易 所 都 是 将 大 数据 作为 商品 进行 交易 ,而 诸如 “数据 
堂 " 这 样 的 电 商 平台 ,2? 则 是 直接 将 大 数据 作为 商品 在 网 上 销售 。5?? 

大 数据 监控 作为 大 数据 侦查 环节 中 的 上 游行 为 ,仅仅 是 数据 的 采集 ， 
尚 不 涉及 数据 的 具体 使 用 行为 。 但 即便 是 静态 的 数据 监控 ,也 会 对 个 人 信 
息 权 产生 巨大 的 危害 。 首 先 ， 大 数据 监控 ?中 含有 大 量 涉及 个 人 隐私 的 数 
据 , 一 旦 造成 泄露 则 后 果 不 堪 设想 。 如 某 些 侦查 机 关 建 立 的 大 数据 平台 ， 
汇集 了 公民 的 人 口 基本 信息 、 住 店 信息 、 车 辆 信息 、 婚 姻 信 息 等 全 面 的 数 
据 , 能 够 清晰 反映 一 个 人 的 完整 生活 轨迹 ;大 数据 公司 收集 的 用 户 数据 中 ， 
包含 有 大 量 涉及 个 人 隐私 的 内 容 甚 至 是 敏感 性 数据 ,如 个 人 身份 信息 、 聊 
天 信息 .邮件 信息 .通讯 信息 、 地 理 位 置信 息 等 。 其 次 ,大 数据 监控 本 身 就 
会 对 公民 的 人 格 独立 和 人 格 尊严 形成 威胁 ,会 使 公民 产生 一 种 不 安 的 心理 
状态 ." 作为 数据 主体 ,我们 却 并 不 知道 与 自己 产生 了 哪些 数据 ,有 多 少 
数据 被 收集 .被 哪些 部 门 所 收集 以 及 数据 的 使 用 途径 。 人 非 圣贤 熟 能 无 


51] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学 报 》,2015(5) 。 

5C2] 数据 堂 旗下 的 数据 商城 (http://www. datamall. comy/) ,出 售 交通 、 图 像 .生活 、 地 理 、 视 
频 等 多 种 类 的 数据 商品 。 

53] 但 这 些 数据 交易 平台 一 般 都 声明 ,用 以 交易 的 数据 都 已 经 过 清洗 ,将 个 人 信息 隐匿 去 。 

54] 郭 瑜 :《 个 人 数据 保护 法 研究 ),101 页 ,北京 ,北京 大 学 出 版 社 ,2012。 
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过 ,每 个 人 或 多 或 少 也 会 留 下 一 些 “ 污 点 数据 ”, 而 这 些 数 据 很 有 可 能 成 为 
侦查 的 决策 依据 ,大 数据 监控 技术 如 同 达 摩 殉 利 斯 之 剑 悬 在 头顶 。 另 外 ， 
大 数据 时 代 的 社会 已 经 丧失 了 遗忘 的 能 力 , 一 旦 在 网 络 上 留 下 数字 化 痕迹 
信息 , 便 打 上 了 永远 的 烙印 ,很 难 被 抹 去 。 

2. 大 数据 的 深度 利用 

如 果 说 “大 数据 监控 ”是 运用 个 人 信息 的 上 游行 为 ,那么 处 理 、 分 析 数 
据 则 是 运用 个 人 信息 的 下 游行 为 。 相 比 于 传统 信息 化 侦查 中 对 数据 的 利 
用 ,大 数据 侦查 在 数据 利用 的 宽度 和 深度 上 都 有 了 大 幅度 提高 ,对 个 人 信 
息 权 带 来 了 更 大 的 威胁 。 

在 传统 侦查 中 对 于 个 人 信息 的 运用 ,无 论 是 信息 化 侦查 还 是 电子 取 
证 ,大 都 属于 较为 简单 “ 找 数据 ”的 功能 ,仅仅 能 够 获取 单一 维度 数据 的 表 
面 信息 。 这 种 传统 的 数据 分 析 尽 管 也 会 对 个 人 信息 权 带 来 一 些 不 利 影响 ， 
例如 会 涉及 与 案件 无 关 的 个 人 隐私 类 信息 ,但 是 毕竟 对 个 人 信息 利用 的 广 
度 和 深度 都 不 大 。 但 是 大 数据 时 代 的 数据 挖掘 技术 则 完全 突破 了 这 一 模 
式 : 中 可 供 分 析 的 个 人 信息 数量 增多 ,引发 个 人 信息 保护 风险 。 现 在 侦查 
机 关 所 构建 的 大 数据 平台 ,能 够 将 个 人 所 有 信息 汇集 到 同一 个 系统 中 , 通 
过 共享 机 制 甚至 还 纳入 社会 数据 信息 ,未 来 随 着 数据 化 进程 的 加 快 ,还 会 
有 更 多 的 数据 纳入 侦查 机 关 的 大 数据 平台 。 侦 查 机 关 对 于 个 人 数据 不 再 
是 原本 简单 的 查询 功能 以 及 在 单一 维度 上 获取 数据 ,而 是 通过 大 数据 技术 
将 多 维度 的 个 人 数据 组 合 到 一 起 。 虽 然 这些 个 人 数据 分 开 来 看 可 能 都 不 
会 对 个 人 隐私 构成 威胁 ,然而 一 旦 组 合 到 一 起 则 能 够 轻易 地 还 原 出 一 个 人 
的 生活 工作 状况 ,行动 轨迹 以 及 人 际 关系 ,进而 反映 出 大 量 个 人 隐私 , 正 所 
谓 量变 引起 质变 。@ 数 据 分 析 的 深度 加 强 , 引 发 个 人 信息 保护 风险 。 相 比 
于 传统 侦查 中 仅 获取 数据 的 表层 信息 ,大 数据 侦查 对 个 人 信息 更 强调 二 次 
利用 、 多 次 利用 。 侦 查 人 员 可 以 基于 不 同 的 主题 任务 来 对 同一 数据 进行 多 
次 挖掘 ,数据 的 价值 并 不 会 因此 而 流失 。 但 数据 的 二 次 利用 也 给 个 人 信息 
权 、 个 人 隐私 带 来 了 新 的 风险 。 很 多 看 起 来 与 隐私 无 关 信息 ,在 大 数据 挖 
掘 技术 的 威力 下 ,就 能 够 得 出 大 量 有 关 个 人 隐私 的 信息 ,这 些 数据 往往 反 
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映 了 人 的 某 些 行为 特征 、 兴 趣 爱 好 习性、 人 物 关系 等 ,机 器 对 个 人 信息 的 
挖掘 其 至 比 信 息 主体 对 自己 的 了 解 还 要 深入 。 

3. 个 人 信息 安全 风险 

这 里 信息 安全 主要 是 指 个 人 数据 安全 ,个 人 数据 安全 也 是 个 人 信息 权 
的 组 成 部 分 ,强调 个 人 数据 处 于 安全 ,不 受 侵犯 与 攻击 的 状态 。 个 人 信息 
安全 在 当下 具有 迫切 的 现实 意义 ,我 国 乃 至 全 世界 个 人 数据 泄露 事件 频频 
发 生 , 例 如 ,2010 年 Google 遭遇 黑客 人 侵 ,20 余 家 企业 的 数据 受到 影响 ， 
中 国 用 户 Gmail 邮箱 数据 被 暴露 ,2013 年 有 1. 52 亿 Adobe 用 户 的 个 人 信 
息 被 窃取 .5 我 国 即将 出 台 的 《网 络 安全 法 (草案 )》 中 也 重点 强调 要 保障 
个 人 信息 安全 。 

大 数据 侦查 中 ,个 人 信息 安全 同样 有 可 能 面临 着 来 自 以 下 的 漏洞 、 风 
念 : 基础 设施 漏洞 ,关键 基础 设施 是 个 人 信息 存储 、 处 理 及 流转 的 基础 环 
境 , 如 果 基 础 设备 .基础 设施 运行 出 现 问题 , 则 会 给 个 人 数据 安全 带 来 物理 
性 的 损坏 ;@ 网 络 系统 漏洞 ,系统 漏洞 会 给 黑客 等 不 法 分 子 留 下 可 乘 之 机 ， 
加 犯罪 分 子 的 恶意 攻击 ,很 大 一 部 分 个 人 数据 泄露 是 由 于 网 络 黑客 的 恶意 
攻击 ,他 们 有 些 出 于 彰显 个 人 技能 的 需求 ,更 多 是 出 于 竞争 利益 冲突 或 是 
商业 驱动 需求 ;@ 内 部 人 员 的 恶意 行为 ,很 多 单位 由 于 业务 需求 会 建 有 用 
户 数据 库 ,尤其 是 随 着 互联 网 .电子 商务 的 发 展 , 越 来 越 多 的 网 络 服务 、 网 
络 购物 平台 掌握 有 大 量 消 费 者 信息 ,一 些 内 部 工作 人 员 经 不 住 利 益 的 诱 
惑 ,往往 会 将 其 所 掌握 的 用 户 信 息 卖 给 犯罪 分 子 。 有 人 根据 对 中 国 裁判 文 
书 网 上 “出 售 ,非法 提供 公民 个 人 信息 罪 ” 判 决 书 的 统计 ,发 现 泄露 个 人 信 
息 的 源头 多 来 自 于 公安 机 关 、 代 理 公司 .交警 及 金融 机 构 等 .522 

在 大 数据 侦查 过 程 中 ,同样 需要 收集 、 存 储 及 分 析 个 人 信息 ,一 般 个 人 
信息 安全 所 面临 的 风险 ,大 数据 侦查 中 也 都 有 可 能 遇 到 ,况且 犯罪 侦查 的 


51] 参见 “盘点 : 五 年 十 大 严重 信息 泄露 事件 ”, 载 新 浪 网 http://tech. sina. com. cn/s/2014- 
07-25/07569516508. shtml, 最 后 访问 时 间 : 2016 年 9 月 30 日。 

52] 参见 :《 你 的 个 人 隐私 ,就 是 这 样 被 “内 鬼 ? 卖 掉 的 !》, 载 网 易 财 经 网 http://money. 163. 
com/16/0909/12/COH900BF002580S6. html, 最 后 访问 时 间 : 2016 年 9 月 25 日 。 
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个 人 信息 往往 都 涉及 更 为 私密 的 个 人 信息 ,如 历史 犯罪 数据 、 身 份 数据 、 通 
信和 数据 ,经 济 数据 等 ,因而 个 人 信息 安全 面临 的 风险 也 更 为 严峻 。 一 旦 大 
数据 侦查 中 相关 信息 泄露 或 是 遭 到 恶意 攻击 ,不 仅仅 会 对 个 人 相关 权益 造 
成 侵害 ,对 整个 司法 程序 甚至 国家 安全 都 会 带 来 严重 威胁 。 例 如 2016 年 
8 月 ,我 国 山东 女孩 徐 玉 玉 因 电信 诈骗 而 致死 的 事件 引起 了 全 社会 的 关注 ， 
而 这 背后 的 源头 就 是 个 人 信息 被 泄漏 。 另外 ,在 大 数据 侦查 过 程 中 ,由 于 
牵涉 数据 共享 .数据 深度 挖掘 等 新 的 机 制 , 要 谨防 在 机 制 建设 过 程 中 所 产 
生 的 新 的 安全 风险 。 


二 、 大 数据 侦查 中 个 人 信息 权 的 保障 制度 


不 少 学 者 提出 大 数据 时 代 要 加 强 个 人 隐私 保护 。 然 而 ,在 大 数据 时 
代 , 传 统 的 隐私 保护 模式 会 失效 。 以 往 的 隐私 保护 采取 的 是 “告知 与 许可 ” 
的 模式 ,权利 保护 着 眼 于 数据 收集 环节 ,相关 义务 和 责任 在 数据 收集 者 ,但 
对 之 后 数据 的 使 用 环节 却 并 没有 规制 。 在 大 数据 的 分 析 模 式 下 ,这 种 传统 
的 “告知 与 许可 ”模式 已 经 难以 发 挥 作用 ,因为 数据 的 主要 价值 主要 体现 在 
数据 分 析 使 用 环节 , 究 况 哪些 数据 涉及 隐私 、 哪 些 隐私 会 被 暴露 出 来 ,在 数 
据 收 集 环节 是 不 得 而 知 的 。 因 此 越 来 越 多 的 学 者 提出 ,大 数据 时 代 要 建立 
一 个 不 同 于 过 去 的 全 新 隐私 保护 模式 ,由 数据 使 用 者 来 承担 个 人 信息 保护 
的 义务 和 责任 ,加 强 对 数据 挖掘 分 析 , 尤 其 对 是 二 次 挖掘 分 析 行 为 进行 规 
制 。 但 是 这 样 一 来 ,又 不 可 避免 地 会 限制 大 数据 价值 的 发 挥 。 

在 侦查 语 境 中 ,需要 结合 个 人 信息 保护 和 侦查 程序 的 基本 规则 ,寻求 个 
人 信息 利用 和 个 人 信息 保护 之 间 最 佳 平衡 。 在 个 人 信息 保护 的 基础 上 ,最 大 
程度 发 挥 大 数据 的 侦查 价值 。 鉴 于 现 阶段 处 于 大 数据 侦查 的 初 建 时 期 ,很 多 
技术 、 方 法 还 有 待 开发 ,因此 权益 的 天 平 可 以 适当 偏向 于 个 人 信息 利用 一 端 。 
与 此 同时 ,也 要 突破 传统 隐私 保护 的 案 白 ,将 法 律 规制 的 重点 放 在 数据 分 析 
使 用 环节 ,强调 信息 主体 对 个 人 数据 的 控制 ,保障 数据 主体 的 知情 权 、 查 询 
权 、 修 改 权 及 删除 权 等 权利 。 本 文 拟 构建 大 数据 侦查 语 境 中 的 个 人 信息 保护 
制度 ,以 填补 我 国 个 人 信息 保护 法 和 刑事 诉讼 法 中 间 的 真空 地 带 。 
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(一 ) 审查 批准 原则 

这 里 所 说 的 审查 批准 原则 本 意 想 借鉴 西方 的 司法 审查 原则 ,司法 审 
查 原则 强调 对 涉及 个 人 自由 、 财 产 、 隐 私 等 权益 的 侦查 活动 ,由 法 院 或 其 
他 司法 机 构 进 行 审 查 。12 但 是 我 国 并 没有 司法 审查 原则 适用 的 土壤 ,在 
涉及 公民 相关 自由 、 财 产 等 权利 的 事项 时 ,一 般 采取 由 领导 或 上 级 部 门 审 
批 的 方式 。 在 大 数据 侦查 中 个 人 信息 的 收集 、 使 用 涉及 公民 的 隐私 权 、 个 
人 信息 权 ` 人 格 尊严 等 权利 ,个 人 信息 的 来 源 及 使 用 行为 同样 应 当 具 有 合 
法 性 ,因而 应 当 可 以 通过 审查 批准 制度 来 保证 所 获取 的 个 人 信息 合法 
有 效 。 

对 此 ,又 可 以 进一步 分 两 种 情况 讨论 。@ 在 个 案 发 生 后 ,侦查 机 关 基 
于 破案 的 需要 ,会 向 大 数据 公司 ,社会 企业 等 第 三 方 调 取 相 关 的 个 人 数据 ， 
其 实质 上 是 一 种 取证 行为 。 根 据 ( 刑 事 诉讼 法 ) 第 52 条 的 规定 ,单位 和 个 
人 有 如 实 提供 证 据 的 义务 。 然 而 ,目前 实务 中 侦查 机 关 向 第 三 方 调 取 个 人 
数据 的 程序 尚 比较 混乱 ,不 同 第 三 方 对 于 调 取 数据 的 程序 要 求 不 尽 一 致 。 
例如 在 向 银行 等 机 构 调 取 数 据 时 需要 履行 由 司法 机 关 负 责 人 签字 的 严格 
审批 程序 ,而 在 向 电信 部 门 调 取 通话 数据 时 则 无 须 履行 如 此 严格 的 程序 ; 
向 有 些 第 三 方 调 取 数 据 时 需要 出 示 《 调 取证 据 通知 书 》 等 司法 文书 ,而 向 有 
些 第 三 方 调 取 数 据 时 出 具 一 般 的 单位 介绍 信 即 可 。 因 此 ,笔者 建议 在 向 第 
三 方 调 取 个 人 数据 时 ,建立 统一 的 审查 批准 制度 ,侦查 人 员 出 具 由 司法 机 
关 负 责 人 签字 审批 的 4( 调 取证 据 通知 书 》 等 司法 文书 ,并 列 明 调 取 事由 、 对 
象 及 调 取 范围 。 从 而 有 效 地 规范 侦查 权 的 合理 运用 ,保障 公民 个 人 信息 
权 。 2 四 然而 ,脱离 个 案 侦查 情况 ,侦查 机 关 在 一 般 数 据 库 建设 中 也 需要 
获取 海量 的 公民 个 人 信息 ,尤其 在 国家 大 数据 战略 下 ,各 个 侦查 机 关 都 在 
兴建 大 数据 平台 ,积极 寻求 与 其 他 部 门 的 数据 共享 合作 。 那 么 ,在 此 过 程 
中 ,侦查 机 关 所 获取 的 海量 公民 个 人 信息 ,其 合法 性 依据 又 何在 呢 ? 从 侦 


51] 陈 瑞 华 :《 刑 事 诉讼 的 前 沿 问题 ),284 页 ,北京 ,中 国人 民 大 学 出 版 社 ,2011。 
C2] 2016 年 “两 高 一 部 ”颁布 的 (关于 办 理 刑事 案件 收集 提取 和 审查 判断 电子 数据 若干 问题 
的 规定 ?中 ,第 13 条 对 调 取 电 子 数据 的 程序 做 了 简要 的 规定 。 
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查 机 关 角 度 出 发 ,收集 的 公民 信息 越 多 则 越 有 利于 侦查 工作 ;而 从 公民 角 

度 出 发 ,侦查 机 关 所 掌握 的 数据 越 多 , 则 越 是 会 造成 心理 上 的 慌 伐 、 担 心 ， 
对 个 人 信息 权 带 来 威胁 。 正 如 有 学 者 所 言 , 大 数据 时 代 政 府 已 经 成 为 个 人 
信息 管理 者 和 利用 者 的 双重 角色 ,但 是 政府 不 能 无 节制 地 收集 和 利用 个 人 
信息 ,个 人 信息 保护 的 发 展 始终 伴随 着 对 政府 权力 的 限制 .512 因此 ,笔者 
认为 可 以 通过 审查 批准 原则 来 赋予 侦查 机 关 在 个 案 之 外 收集 公民 个 人 信 
息 、 建 立 数据 库 的 合法 性 ,但 这 里 不 宜 由 侦查 部 门 自己 来 决定 收集 公民 个 
人 信息 的 合法 性 。 至 于 由 哪个 机 关 负 责 审 查 ,或 许可 以 仿照 日 本 “特定 个 
人 信息 保护 委员 会 ”德国 “个 人 资料 保护 委员 会 ”这样 的 机 构 ,5? 由 专门 
的 第 三 方 组 织 来 负责 对 政府 或 司法 机 关 收 集 、 利 用 公民 个 人 信息 的 行为 
进行 监督 。 在 侦查 机 关 建 立 涉 及 公民 个 人 信息 的 数据 库 以 及 与 其 他 部 门 
进行 数据 合作 共享 之 前 ,应 当 报 第 三 方 机 构 审 查 批准 ,以 获得 合法 的 
授权 。 

(二 ) 个 人 参与 原则 

个 人 参与 是 个 人 信息 保护 法 中 的 一 项 重要 基本 原则 ,是 指数 据 主体 对 
其 数据 收集 、 处 理 情况 享有 知情 的 权利 ,以 及 要 求 查询 、 修 改 个 人 数据 的 权 
利 。 数 据 收集 者 应 当 向 数据 主体 说 明 数 据 的 收集 、 使 用 情况 ;数据 主体 有 
权利 向 数据 处 理 者 查询 自己 数据 的 处 理 情况 ; 当 发 现 数据 有 错误 时 ,数据 
主体 可 以 提出 修改 、 删 除 等 要 求 .7 在 大 数据 侦查 中 构建 个 人 参与 原则 ， 
同样 可 以 分 两 种 情形 讨论 。 

(1) 在 个 案 侦查 中 ,基于 侦查 的 保密 性 ,个 人 参与 原则 应 当 受 到 一 定 的 
限制 ,但 仍 可 以 通过 传统 的 侦查 程序 来 行使 个 人 参与 的 权利 。 如 通过 阅卷 
权 来 知悉 个 人 信息 的 使 用 情况 ,通过 辩护 权 对 错误 的 个 人 信息 提出 修改 、 
删除 的 请 求 。 


51] 张 新 宝 :《 从 隐私 到 个 人 信息 : 利益 再 衡量 的 理论 与 制度 安排 ), 载 (中 国法 学 》,2015(3)。 

52] 中 立 的 第 三 方 ,具有 公法 机 关 地 位 ,对 政府 收集 ,利用 个 人 信息 的 行为 进行 监督 。 

53] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015 
(5)。 


» 167。» 


大 数据 侦查 


(2) 在 一 般 的 个 人 信息 数据 库 建 设 中 ,同样 应 当 赋 予 公民 一 定 范围 内 
的 参与 权 。 在 不 影响 侦查 工作 展开 的 前 提 下 ,不妨 以 公告 形式 告知 公民 一 
定 范围 内 数据 的 收集 范围 及 使 用 目的 ,7 从 而 保证 公民 对 个 人 信息 的 知情 
权 。 如 《德国 联邦 个 人 资料 保护 法 《美国 隐私 法 案 ) 都 规定 了 国家 机 关 在 
收集 个 人 信息 时 ,应 当 保 障 信息 主体 的 知情 同意 。 同 时 ,在 不 影响 侦查 工 
作 的 情况 下 ,应 当 开 通 一 定 的 查询 渠道 ,确保 公民 能 够 查询 到 自己 的 有 关 
个 人 信息 ,对 于 错误 .过 时 的 数据 ,公民 应 该 及 时 通知 相关 机 关 修 改 、 删 
除 ."? 如 日 本 的 “共同 番号 制度 "my number) 中 ,政府 通过 “番号 ”对 公民 
信息 开展 全 面 采集 ,公民 个 人 可 以 在 政府 专门 网 站 上 查询 到 自己 到 底 有 哪 
些 信息 被 政府 收集 了 ,番号 被 哪些 单位 所 使 用 及 使 用 的 原因 ,这 就 很 好 地 
保障 了 信息 主体 的 参与 权 。 

(三 ) 比例 原则 

比例 原则 实则 来 源 于 个 人 信息 保护 体系 中 的 “有 限 处 理 原 则 ”, 管 理 者 
在 处 理 个 人 数据 的 时 候 要 秉持 谦 抑 、 克 制 的 态度 ,对 于 数据 的 处 理 数 量 和 
处 理 方式 都 要 在 当初 的 目的 范围 之 内 。" ”比例 原则 同样 也 是 侦查 程序 中 
的 一 项 基本 原则 ,强调 侦查 人 员 在 诉讼 目的 范围 内 采取 侦查 措施 ,从 而 将 
对 公民 权利 的 侵害 程度 降 至 最 小 ."* 从 某 种 程度 上 来 说 ,个 人 信息 保护 中 
的 有 限 处 理 原 则 与 侦查 中 的 比例 原则 实质 上 不 谋 而 合 。 

本 文中 比例 原则 有 两 层 含义 ,首先 ,侦查 机 关 所 收集 的 数据 在 实现 侦 
查 目 的 的 基础 上 应 控制 在 最 少 范围 内 ;其 次 ,应 采用 合理 的 技术 手段 收集 、 
处 理 数据 ,不 得 破坏 数据 的 完整 性 、 真 实 性 以 及 损害 数据 主体 的 其 他 权 
益 。"， 具体 而 言 , 在 大 数据 侦查 过 程 中 ,无 论 是 收集 数据 还 是 分 析 、 处 理 数 
据 , 无 论 针 对 犯罪 分 子 还 是 其 他 公民 的 个 人 信息 ,都 应 采取 对 个 人 权益 影 


C1] 可 以 仿照 网 络 平台 “隐私 权 保护 声明 ”, 告 知 用 户 会 收集 的 信息 以 及 信息 的 使 用 情况 。 

52] 不 过 这 些 公告 ` 可 以 查询 的 数据 库 是 有 一 定 范围 限制 的 ,对 于 一 些 对 侦查 工作 有 重大 影 
响 的 .需要 保密 的 数据 库 则 不 宜 公 开 。 

53] 郭 瑜 :《 个 人 数据 保护 法 研究 ),170 页 ,北京 ,北京 大 学 出 版 社 ,2012。 

C54] 陈 永生 :《 侦 查 程序 原理 论 ),149 一 150 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ,2003。 

55] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015(5)。 
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响 最 小 的 方式 进行 ,保障 个 人 数据 的 完整 性 、 真 实 性 和 有 效 性 ;除非 案件 特 
殊 要 求 ,不 得 采集 个 人 敏感 信息 ;对 数据 库 实行 访问 控制 ,尽量 缩小 可 以 直 
接 接 触 个 人 信息 的 侦查 人 员 范 围 , 严 格 限制 数据 使 用 者 和 管理 者 的 权限 
在 不 影响 案件 侦查 的 情况 下 ,对 一 些 与 案件 无 关 的 关键 性 身份 识别 信息 可 
以 通过 加 密 技术 、 匿 名 化 方法 、 代 码 蔡 代 等 方式 进行 遮 项 ,等 到 最 后 识别 的 
犯罪 行为 及 可 疑犯 罪 分 子 之 后 再 予以 公开 。"1) 

(四 ) 相关 性 原则 

个 人 信息 保护 制度 中 有 “目的 明确 ”目的 限制 ”原则 ,要 求 数据 在 收集 
之 前 就 必须 要 有 正当 的 、 明 确 的 目的 ,在 数据 使 用 过 程 中 也 必须 紧 紧 围绕 
目的 来 进行 。 在 大 数据 侦查 过 程 中 ,数据 的 收集 、 获 取 必 须 基 于 案件 调查 
取证 的 需求 或 其 他 职能 的 需求 ,不 得 超出 侦查 机 关 的 职能 范围 。 数 据 的 处 
理 和 使 用 也 必须 在 侦查 职能 范围 之 内 进行 ,与 案件 线索 获取 ,证据 调 查 相 
关 。52? 对 于 大 数据 侦查 中 获取 的 个 人 信息 ,例如 通过 数据 库 所 查询 到 的 犯 
罪 嫌疑 人 家 庭 成 员 信息 ,通过 数据 挖掘 技术 所 获取 犯罪 嫌疑 人 的 数据 画 
像 、 人 际 关系 网 ,行为 偏好 等 个 人 信息 , 仅 能 用 于 侦查 的 需要 ,不 得 男 作 他 
用 ;所 获取 的 与 案件 侦查 无 关 的 个 人 信息 、 他 人 信息 ,应 当 及 时 销毁 。 

(五 ) 责任 及 救济 制度 

对 于 在 大 数据 侦查 过 程 中 违规 收集 ,处理 个 人 信息 的 行为 ,例如 超出 
职权 范围 收集 、 分 析 个 人 信息 ,将 个 人 数据 用 作 侦 查 职能 以 外 目的 ,违法 披 
露 个 人 数据 等 非法 行为 ,因此 而 遭受 侵害 的 数据 主体 可 以 按照 (刑事 诉讼 
法 ) 第 47 条 、 第 98 条 规定 寻求 救济 。 对 于 具体 的 责任 人 员 , 应 当 根 据 侵权 
行为 的 不 同 程度 ,进行 相应 的 纪律 处 分 、 行 政 处 分 等 措施 ,构成 犯罪 的 ,应 
当 按照 4 刑法 》 第 253 条 “侵犯 公民 个 人 信息 罪 ” 等 相关 罪名 追究 刑事 


责 任 。533 





51] 刘 铭 :《 大 数据 反 念 应 用 中 的 法 律 问题 分 析 ), 载 (河北 法 学 》,2015(2)。 
[2] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》,2015(5)。 
53] 《刑法 修正 案 ( 九 )》 对 侵犯 公民 个 人 信息 罪 又 进行 了 扩充 。 


*。 169。 


大 数据 侦查 


(六 ) 其 他 制度 

除了 程序 性 规制 外 ,还 可 以 从 数据 使 用 权限 ,管理 制度 上 来 加 强 对 个 
人 信息 的 保护 。 首 先 ,可 以 通过 访问 管理 控制 来 对 数据 资源 进行 不 同 的 访 
问 授权 ,防止 非 授 权 人 员 进 行 核心 数据 系统 。 在 专业 侦查 队伍 中 ,可 以 根 
据 每 个 人 职能 的 不 同 赋予 其 相应 的 数据 访问 、 使 用 权限 ,对 于 实务 办 案 部 
门 应 当 分 配 较 大 的 权限 ,赋予 部 门 管理 人 或 主要 办 案 人 员 较 大 的 数据 权 
限 ;或 者 按照 各 办 案 小 组 进行 数据 权限 分 配 ,例如 在 主任 检察 官制 度 实行 
之 后 ,可 以 赋予 各 主任 检察 官 较 大 的 数据 访问 权限 。 其 次 ,可 以 通过 密 钥 、 
口令 .生物 识别 等 身份 认证 技术 来 确保 数据 访问 人 员 身 份 的 可 靠 性 ,确保 
用 户 的 真实 身份 "1 保证 每 次 登录 、 操 作 都 对 应 到 专人 ,每 一 步 操作 都 留 
下 数据 痕迹 。 


第 二 节 ”大 数据 侦查 的 程序 保障 制度 


一 、 大 数据 侦查 的 “黑箱 效应 ” 


黑箱 效应 (black box) 是 指 对 于 一 个 系统 只 知道 输入 和 输出 结果 ,而 并 
不 了 解 其 内 部 运作 机 制 , 整 个 过 程 是 不 透明 的 ,一 般 用 来 形容 某 种 算法 、 蝇 
体 管 或 者 人 的 大 脑 等 ."*? 在 专业 技术 领域 ,很 多 学 者 将 大 数据 决策 机 制 比 
喻 为 "黑箱 效应 ”, 意 指 大 数据 运行 ,决策 过 程 的 不 透明 ,人 们 只 看 到 数据 的 
输入 和 输出 结果 ,而 对 其 运算 过 程 却 一 无 所 知 。 在 这 样 不 透明 的 机 制 中 ， 
数据 的 错误 .数据 算法 的 偏差 无 法 得 到 纠正 ,甚至 是 专业 技术 人 员 都 难以 
准确 找到 错误 的 根源 。 一 旦 大 数据 “黑箱 效应 ”蔓延 至 侦查 领域 ,将 产生 不 
可 估量 的 后 果 一 一 当事人 或 利害 关系 人 (数据 主体 ) 不 知道 他 们 的 哪些 相 
关 数 据 被 采集 .哪些 数据 被 用 于 侦查 中 ,不 知道 系统 所 采取 的 算法 原理 ,更 


51] 张 尼 、 张 云 勇 等 :《 大 数据 安全 技术 与 应 用 》,105 页 ,北京 ,人 民 邮 电 出 版 社 ,2014。 
C52] 维基 百科 “Black box” 词 条 , 载 维 基 百 科 网 https://en. wikipedia. org/ wiki/Black_box， 
最 后 访问 时 间 : 2016 年 9 月 26 日 。 
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不 知道 数据 分 析 结 果 以 及 对 他 们 的 权益 所 带 来 的 影响 。 

例如 在 美国 “ 禁 飞 系统 ”中 (No Fly System) ,大 数据 算法 会 将 航空 旅客 
的 姓名 与 禁 飞 名 单 相 比 对 ,对 于 被 “命中 ”的 旅客 ,其 姓名 会 被 移送 到 " 恺 怖 
分 子 审查 中 心 ”(Terrorist Screening Center) ,由 中 心 的 官员 来 判断 其 有 无 
实施 恺 怖 活动 的 可 能 性 。 但 是 据 证 实 , 有 一 半 被 移送 到 审查 中 心 的 当事人 
都 是 无 辜 的 ,这 里 面 既 有 数据 源 的 错误 ,也 有 算法 的 错误 。 这 些 不 幸 被 “ 命 
中 ?的 旅客 会 被 当局 留置 ,需要 回答 当局 官员 提出 的 大 量 问题 ,花费 巨大 的 
时 间 、 精 力 去 解释 自己 是 无 境 的 。 关 键 问 题 是 旅客 们 根本 不 知道 自己 的 哪 
些 数据 记录 触犯 了 禁 飞 系统 的 算法 ,往往 百 口 莫 辩 .12 试想 一 下 ,我国 若 
建立 大 数据 高 危 分 子 预警 系统 ,通过 大 数据 算法 来 预测 一 个 人 有 多 大 的 概 
率 去 实施 犯罪 并 对 其 采取 相关 的 措施 。 在 这 样 的 机 制 中 ,一 个 人 是 否 有 犯 
罪 嫌 疑 .是 否 需要 被 立案 很 大 程度 上 要 听命 于 大 数据 算法 ,一 旦 数据 源 或 
算法 有 误 ,将 某 人 误 列 为 高 危 分 子 或 刑 嫌 人 员 , 便 会 对 他 们 的 人 身 权 、 自 由 
权 以 及 人 格 尊严 造成 巨大 的 伤害 。 更 可 怕 的 是 ,这 样 大 数据 侦查 决策 机 制 
是 不 透明 的 。 当 事 人 处 于 被 “秘密 ?审查 的 状态 ,根本 没有 机 会 参与 到 大 数 
据 决策 程序 中 ,他 们 不 知道 自己 的 名 字 是 否 在 “ 黑 名单 ” 上 ,也 不 知道 到 底 
哪 条 数据 触 磁 了 大 数据 算法 系统 .'? 尽管 这 些 问题 是 缘 于 大 数据 本 身 的 
技术 特征 ,但 无 形 中 对 传统 诉讼 中 的 正当 程序 产生 了 冲击 和 影响 。53? 

“正当 程序 ”作为 现代 刑事 诉讼 的 理论 基石 ,其 最 早 诞生 于 英国 的 普通 
法 ,1215 年 英国 (大 宪章 ;第 39 条 确立 了 正当 程序 的 法 条 和 雏形 。 产 生 于 英 
国 的 正当 程序 原则 之 后 在 美国 又 得 到 了 进一步 的 发 展 ,美国 联邦 法 院 确立 
了 一 整套 用 以 保障 正当 程序 的 规则 体系 。“ 二 战 ”之 后 ,英美 法 系 的 正当 程 
序 原则 进入 国际 视野 ,适用 于 更 多 的 诉讼 程序 ,具有 开放 性 和 包容 性 ,5 


[1] Citron, Danielle Keats, “ Technological Due Process”, Washington University Law 
Review ,6 (2008) ,pp. 1249-1314. 

52] 民事 诉讼 ,行政 诉讼 中 都 出 现 了 将 大 数据 作为 证 据 使 用 的 案例 。 

[3] See Crawford,Kate .Schultz,Jason,”“Big Data and Due Process: Toward a Framework 
to Redress Predictive Privacy Harms” ,Boston College Law Review,1(2014) ,pp. 93-128. 

54] 魏 晓 娜 :《 刑 事 正当 程序 原理 》,1~9 页 ,北京 ,中 国人 民 公安 大 学 出 版 社 ,2006。 
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正当 程序 作为 刑事 诉讼 的 基本 原则 ,其 指导 性 思想 不 仅仅 体现 在 审判 过 程 
中 ,在 审 前 的 侦查 及 审查 起 诉 过 程 中 ,同样 要 遵循 正当 程序 原则 ,辩护 权 、 
禁止 酷刑 .保障 人 格 尊严 和 保障 人 身 自由 等 程序 性 规定 都 是 正当 程序 的 应 
有 之 义 。 正 当 程 序 的 目的 主要 是 为 了 保护 公民 的 基本 权益 ,如 公平 .公正 、 
透明 参与、 准确、 隐私 .尊严 等 公民 的 基本 权利 价值 .512 很 多 学 者 都 提出 
过 正当 程序 的 评价 标准 ,如 美国 的 Henry Friendly 法 官 提出 了 十 一 项 正当 
程序 评价 标准 ,包括 中 立 的 裁判 者 、 通 知 义务 、 提 出 异议 权利 \ 传 唤 证 人 、 知 情 
权 、 证 据 裁 判 原 则 ,咨询 的 权利 .记录 的 权利 .说 理解 释 的 权利 .公众 参与 原 
则 .司法 评价 原则 .5 ?2 在 美国 的 司法 实务 中 ,很 多 案例 遵循 了 以 下 四 项 正当 
程序 标准 : 参与 原则 ,中 立 的 裁决 者 ,程序 优先 ,权利 贯穿 整个 诉讼 程序 .53? 

笔者 认为 ,根据 正当 程序 要 求 ,在 侦查 中 大 数据 "黑箱 效应 ”至 少 在 以 
下 几 方 面 不 符合 正当 程序 的 要 求 。@ 程 序 不 透明 。 程 序 不 透明 是 大 数据 
决策 机 制 出 现 问题 的 根源 。 一 是 技术 程序 的 不 透明 。 在 大 数据 运行 过 程 
中 ,数据 来 源 .数据 清洗 过 程 . 数 据 算法 、 模 型 参数 等 都 处 于 不 可 知 的 状态 ， 
数据 采集 是 否 有 偏差 数据 质量 是 否 可靠 、 数 据 模 型 设计 是 否 合理 都 难以 
进行 审查 ;二 是 法 律 程序 的 不 透明 ,技术 的 不 透明 也 间接 造成 法 律 程序 的 
不 透明 。 不 仅仅 是 当事人 及 利害 关系 人 不 知道 大 数据 侦查 的 数据 结果 及 
算法 依据 ,就 连 侦查 人 员 本 身 可 能 也 并 不 十 分 清楚 数据 算法 的 原理 。@ 当 
事 人 的 知情 权 和 辩护 权 得 不 到 保障 。 在 大 数据 决策 机 制 不 透明 的 情况 下 ， 
当事人 的 知情 权 无 法 得 到 保障 。 当 事 人 无 法 获悉 其 是 否 被 列 为 高 危 分 子 
或 嫌疑 人 员 、 被 采取 侦查 措施 的 依据 何在 ,进而 也 没有 机 会 对 侦查 机 关 的 
大 数据 分 析 结 果 提 出 辩解 意见 ,况且 他 们 根本 不 具备 质疑 "大 数据 ”的 专业 
知识 。 例 如 ,在 高 危 分 子 预警 系统 中 ,侦查 人 员 会 对 嫌疑 人 的 历史 犯罪 数 


[1] See Redish, Martin H.; Marshall, Lawrence C. “Adjudicatory Independence and the 
Values of Procedural Due Process” ,Yale Law Journal ,3 (1986) ,pp. 455-505. 

C2 dee Pilendly, Teniy J “Some, Rid of Hoorning™ Uivernily wf Piniyioania: Eaw 
Review ,6 (1975) ,pp. 1267-1317. 

[3] See Crawford,Kate ,Schultz,Jason,“Big Data and Due Process: Toward a Framework 
to Redress Predictive Privacy Harms” ,Boston College Law Review,1(2014) ,pp. 93-128. 
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据 、 旅 馆 住宿 数据 上 网 数据 交通 出 行 数据 等 进行 分 析 , 并 据 此 进行 犯罪 
风险 、 概 率 的 评 断 以 及 采取 相关 侦查 措施 。 但 在 此 过 程 中 ,嫌疑 人 根本 不 
知道 他 们 的 哪些 数据 被 侦查 人 员 所 用 ,这 其 中 或 许 混 人 了 他 人 的 数据 、 错 
误 的 数据 抑或 是 错误 的 算法 ,但 嫌疑 人 由 于 处 于 完全 不 知情 的 状态 ,根本 
无 从 为 自己 辩解 。 轩 说 理 阐释 制度 得 不 到 保障 。 侦 查 环 节 中 的 说 理 阐 释 
一 般 用 于 令 状 制度 的 司法 体系 中 ,强调 侦查 人 员 对 强制 性 侦查 措施 进行 解 
释 说 明 , 以 便于 法 官 进行 司法 审查 ,也 有 利于 当事人 对 侦查 措施 的 接受 。 
一 般 的 说 理 阐 释 都 是 基于 经 验 的 事实 认定 以 及 法 律 适用 的 说 明 , 然 而 ,对 
基于 大 数据 方法 的 侦查 措施 ,侦查 人 员 则 缺乏 专业 的 技术 知识 来 解释 说 
明 。 例 如 大 数据 结果 显示 ,在 A 地 区 明 晚 有 70% 的 概率 发 生 盗窃 罪 ,警方 
据 此 在 A 地 区 展开 巡逻 并 对 嫌疑 人 进行 拦截 .盘查 等 措施 ,那么 警方 应 当 
能 够 解释 这 70% 的 数据 是 如 何 得 出 的 ;再 如 ,高 危 人 员 预 测 系 统 根 据 历史 
犯罪 数据 \ 住 宿 数 据 、 上 网 数据 等 信息 计算 出 某 人 具有 80% 的 犯罪 概率 , 警 
方 根据 每 个 人 危险 性 指数 的 不 同 来 部 署 相关 侦查 措施 ,那么 警方 同样 应 当 
能 够 对 这 80% 概 率 的 数据 来 源 、 算 法 进行 解释 说 明 。 


二 、 大 数据 侦查 的 正当 程序 规制 


越 来 越 多 的 学 者 认为 要 从 程序 的 角度 对 大 数据 侦查 机 制 进行 规制 , 规 
范 大 数据 技术 在 司法 程序 中 的 运用 。 本 书 对 侦查 中 的 大 数据 决策 机 制 提 
出 以 下 几 方 面 程序 规制 的 建议 。 

(1) 通知 及 解释 程序 。 知 情 权 是 公民 的 基本 权利 之 一 ,当事人 在 司法 
程序 中 同样 享有 知情 权 。522 根据 知情 权 的 内 涵 , 国 家 不 能 秘密 地 就 将 大 数 
据 决策 机 制 用 于 涉及 公民 人 身 自 由 权益 的 程序 中 。 对 于 因 大 数据 决策 机 
制 而 遭受 不 利 的 当事人 ,司法 人 员 在 对 其 采取 侵犯 人 身 自由 权利 的 相关 侦 
查 措 施 时 ,在 不 涉及 国家 秘密 、 商 业 秘密 及 案件 正常 进展 的 情况 下 ,应当 告 
知 其 作为 侦查 依据 的 大 数据 分 析 结 果 , 包 括 数据 源 及 简要 算法 、 原 理 等 内 


51] 钱 育 之 :《 知 情 权 : 犯罪 嫌疑 人 的 基本 权利 》, 载 (求索 ),2007(8) 。 
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容 。 例 如 ,大 数据 高 危 人 员 预 警 系统 算出 某 人 具有 80% 的 概率 在 A 地 区 从 
事 汽车 盗窃 犯罪 ,警方 在 A 地 夜间 巡逻 时 发 现 了 形迹 可 疑 的 嫌疑 人 A, 对 
其 拦截 ,盘查 并 带 回 警察 局 进一步 调查 。 那 么 此 时 警方 应 当 告 知 嫌疑 人 A 
其 被 怀疑 的 依据 是 大 数据 分 析 结果 ,从 而 为 当事人 的 辩解 提供 依据 。 

(2) 赋予 当事人 异议 权 。 在 侦查 人 员 告 知 大 数据 分 析 结 果 的 基础 上 ， 
应 当 赋予 因 此 而 遭受 不 利 当 事 人 提出 异议 的 权利 ,毕竟 最 了 解数 据 是 否 有 
误 的 莫 过 于 当事人 自己 。 具 体 而 言 ,当事人 可 以 从 正 、 反 两 个 角度 提出 异 
议 。 从 反面 角度 看 ,不 排除 有 重 名 、 数 据 错误 、 数 据 过 时 等 情况 ,当事人 可 
以 对 数据 源 是 否 正 确 、 数 据 算法 、 数 据 分 析 结 果 是 否 合理 等 提出 异议 (可 以 
求助 于 相关 领域 的 专家 ) ;从 正面 角度 来 看 ,当事人 可 以 另行 提出 与 大 数据 
分 析 结 果 相 反 的 其 他 证 据 。 经 审查 确 有 错误 的 ,当事人 可 以 要 求 侦查 机 关 
更 改 与 自己 有 关 的 错误 数据 ,要 求 将 自己 从 黑 名 单 上 移 除 。 鉴 于 大 数据 的 专 
业 性 ,当事人 可 以 借助 相关 领域 具有 专门 知识 人 (如 数据 分 析 师 ?的 帮助 。 

(3) 数据 溯源 制度 。 在 大 数据 决策 机 制 中 ,一 旦 出 现 了 问题 ,需要 根据 
数据 流转 、 运 用 的 记录 来 查找 错误 的 根源 。 然 而 在 很 多 系统 设计 中 ,并 没 
有 对 数据 的 生成 .流转 及 运用 过 程 进行 记录 。 这 些 数据 记录 的 缺失 ,有 些 
是 由 于 本 身 技术 的 缺 位 造成 ,还 有 些 则 是 人 为 故意 没有 设置 数据 记录 、 保 
存 系统 ,以 规避 日 后 出 现 纠纷 时 的 审查 . 追 责 。 实 际 上 ,在 大 数据 侦查 的 决 
策 机 制 中 ,数据 记录 ,保存 功能 非常 重要 ,数据 源 、 数 据 算法 的 开 示 都 需要 
在 数据 记录 的 基础 上 来 完成 ;一 旦 发 现 数据 分 结果 有 误 ,还 需要 根据 数据 
流转 的 历史 记录 来 查找 错误 的 源头 。 笔 者 认为 ,对 于 大 数据 侦查 决策 系统 
中 的 数据 记录 功能 ,可 以 借助 “数据 溯源 "(provenance of the data) 技 术 来 
实现 。 数 据 溯源 是 大 数据 体系 中 的 专业 术语 ,大 意 就 是 指数 据 档案 ,通过 
技术 手段 将 数据 的 产生 、 推 移 演化 的 整个 过 程 保存 、 记 录 下 来 , 既 包 括 静 态 
的 数据 源 信息 ,也 包括 动态 的 数据 演化 过 程 .1 也 可 以 采用 审计 追踪 
Caudit trail) 的 方式 ,对 数据 来 源 、 数 据 收集 、 数 据 清 洗 、 数 据 分 析 以 及 所 涉 


51] 高明, 金 流 清 等 : (数据 世 系 管理 技术 研究 综述 ), 载 (计算 机 学 报 》,2010(3)。 
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及 的 事实 及 法 律 规则 等 步骤 进行 记录 、 保 存 , 形 成 完整 的 数据 保管 链 ; 还 
有 学 者 认为 可 以 参照 食品 安全 、 环 境 领 域 的 溯源 机 制 ,将 大 数据 作为 产品 
来 设计 溯源 方法 ,记录 数据 的 每 一 次 运动 路 径 信息 、 所 处 的 状态 及 用 途 , 并 
辅 之 以 溯源 技术 标准 、 信 息 登记 制度 ,溯源 监督 制度 等 .‘? ”其 实 笔 者 认为 ， 
目前 不 妨 将 大 数据 溯源 程序 直接 融入 侦查 工作 中 去 。 侦 查 人 员 在 运用 大 
数据 系统 时 ,必然 要 登录 、 查 询 数 据 库 ,依托 于 大 数据 平台 进行 数据 分 析 。 
可 以 通过 对 侦查 人 员 每 一 次 登录 、 操 作 行 为 的 日 志保 存 来 进行 数据 溯源 ， 
将 数据 使 用 记录 定位 到 具体 的 人 , 既 有 利于 节约 成 本 ,也 保证 大 数据 流转 
过 程 的 记录 更 加 精细 完整 。 

(4) 其 他 程序 要 求 。 有 学 者 从 技术 角度 提出 ,应 当 对 大 数据 分 析 产 品 、 
软件 及 系统 进行 定期 检测 。 司 法 机 关 所 运用 的 大 数据 分 析 系 统 , 一 般 都 是 
由 市 场 化 的 开发 商 所 设计 生产 ,难免 会 包含 开发 商 一 些 经 济 利益 的 考量 。 
因而 ,应 当 有 专门 的 ,中 立 的 配套 检测 、 评 估 软 件 , 来 对 大 数据 系统 的 软件 、 
技术 进行 定期 检测 、 查 补漏 洞 及 升级 "3 这 种 技术 检测 要 做 到 “三 同时 ”， 
在 正式 投入 运行 之 前 、 系 统 运行 过 程 中 以 及 相关 法 律 规则 发 生变 化 的 时 
候 , 都 要 及 时 进行 技术 检测 .安全 评估 并 升级 换代 。 


第 三 节 大 数据 侦查 的 相关 配套 机 制 


上 文 从 权利 保障 和 程序 规制 的 角度 来 探讨 大 数据 侦查 的 制度 构建 。 
然而 ,大 数据 侦查 是 一 个 复杂 多 元 的 体系 ,除了 法 律 规制 外 ,还 需要 相关 技 
术 、, 管 理 机 制 等 配套 制度 的 支持 。 本 节 从 数据 共享 .技术 平台 构建 以 及 大 
数据 公司 行业 规范 这 三 个 角度 来 探讨 大 数据 侦查 的 配套 机 制 。 


[1] Citron, Danielle Keats, “ Technological Due Process”, Washington University Law 
Review ,6 (2008) ,pp. 1249-1314. 

[C2] 王 忠 . 拒 建立 :《 大 数据 环境 下 个 人 数据 隐私 泄露 溯源 机 制 设计 》, 载 (中 国 经 济 流通 》， 
2014(8) 。 

[3] See Crawford,Kate ,Schultz,Jason,“Big Data and Due Process: Toward a Framework 
to Redress Predictive Privacy Harms”,Boston College Law Review,1(2014) ,pp. 93-128. 
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一 、 大 数据 侦查 的 数据 共享 机 制 


(一 ) 数据 壁垒 现象 严重 

当前 大 数据 侦查 建设 中 首当其冲 的 问题 就 是 数据 壁垒 、 数 据 孤岛 现 
象 。 现 在 可 供 利用 的 数据 量 并 非 不 够 ,只 是 由 于 这 些 数据 分 属于 不 同 的 部 
门 所 有 ,各 个 数据 库 处 于 分 橡 、 制 据 的 状态 ,形成 一 个 个 “数据 孤岛 "。 数 据 
孤岛 导致 大 部 分 数据 处 于 沉睡 状态 ,只 能 发 挥 基 本 的 查询 ,搜索 等 功能 ,无 
法 整合 进行 全 面 的 、 深 度 的 数据 分 析 , 难 以 发 挥 大 数据 潜在 的 价值 。 男 外 ， 
不 同 部 门 的 数据 还 存在 着 数据 格式 差异 、 内 容重 复 、 标 准 不 一 等 现象 ,数据 
标准 的 不 统一 也 加 剧 了 数据 壁垒 现象 。 数 据 壁 又 体现 在 侦查 机 关 与 社会 
行业 数据 的 不 流通 ,以 及 侦查 机 关内 部 数据 资源 的 不 流通 。 

侦查 机 关 与 外 部 的 数据 壁垒 体现 在 如 下 两 个 方面 : 侦查 机 关 与 政府 
数据 库 、 社 会 行业 数据 库 之 间 存在 严重 的 数据 壁垒 。 就 公安 机 关 而 言 , 尽 
管 其 已 经 与 网 吧 上 网 人 员 数 据 库 、 旅 馆 住 宿 人 员 等 数据 库 建立 了 共享 机 
制 , 但 可 供 利用 的 数据 种 类 毕竟 是 少数 ,实务 中 还 是 需要 不 断 地 向 其 他 部 
门 去 " 借 ? 数 据 库 ; 检 察 机 关 自 侦 部 门 可 以 利用 的 政府 及 社会 数据 库 就 更 少 
了 。 据 一 线 侦查 人 员 反 映 ,他 们 在 侦查 中 或 须 关 于 房产 .水 电 、 物 流 、 医 疗 、 
租房 中 介 等 一 线 的 社会 数据 ,但 是 目前 尚未 与 这 些 社会 行业 数据 库 之 间 建 
立 起 共享 机 制 。 四 实务 中 数据 查询 的 烦琐 程序 加 剧 了 数据 壁垒 现象 。 侦 
查 部 门 在 自 有 数据 有 限 的 情况 下 ,往往 需要 向 其 他 行业 去 “ 借 ” 数 据 库 , 但 
是 “ 借 数 据 ”" 的 过 程 却 相当 烦琐 。 例 如 反 贪 部 门 在 去 银行 调 取 嫌疑 人 资金 
账户 数据 时 需要 履行 严格 的 手续 ,并 且 很 多 地 方 目前 只 能 获取 与 案件 有 关 
的 纸 质 版 数据 ; 青 如 话 单数 据 一 般 只 能 在 市 一 级 电信 部 门 调 取 ,并 且 一 次 
只 能 获取 六 个 月 之 内 的 通话 数据 。 数 据 壁 人 又、 数据 查询 的 不 通畅 ,给 侦查 
中 线索 .证据 的 获取 带 来 了 极 大 的 不 便 , 侦 查 人 员 需 要 浪费 极 大 的 时 间 、 精 
力 在 数据 获取 上 ,往往 延误 了 最 佳 侦 查 时 机 。 

在 侦查 机 关内 部 ,同样 存在 着 严重 的 数据 壁垒 现象 。@ 不 同 区 域 、. 不 
同 级 别 .不同 侦查 部 门 之 间 的 数据 共享 程度 低 , 侦查 系统 内 部 数据 共享 参 
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差 不 齐 。 除 了 少量 全 国 范围 内 共享 的 数据 库 , 如 全 国人 口 基本 信息 数据 
库 ` 行 贿 人 员 档 案 数据 库 等 ,各 省 、 市 侦查 机 关 的 数据 库 一般 都 有 地 域 限 
制 , 大 都 处 于 各 自 为 政 的 状态 , 互 不 流通 开放 。 名 实务 中 的 权限 问题 又 加 
剧 了 数据 壁垒 现象 。 很 多 数据 系统 设计 的 初衷 本 是 全 国 统一 应 用 ,例如 检 
察 机 关 的 统一 业务 应 用 系统 ,"! 却 人 为 设置 了 诸多 权限 ,不 同 地 区 ,不 同 级 
别 , 不 同 岗位 的 人 所 拥有 的 权限 都 不 一 样 。 这 种 数据 权限 呈 倒 金字 塔 形 ， 
越 是 高 级 别 的 部 门 享有 的 数据 权限 越 大 , 越 是 基层 的 部 门 享有 的 数据 权限 
越 少 ,然而 实务 中 却 恰恰 是 基层 侦查 部 门 对 数据 的 需求 最 大 。 

究 其 原因 ,各 个 部 门 在 数据 共享 .开放 问题 上 ,普遍 有 “不 想 开 ,不 敢 
开 , 不 会 开 ” 的 心理 : 不 想 开 是 指 很 多 部 门将 数据 视 作 部 门 财产 和 利益 , 基 
于 部 门 利益 保护 而 不 愿意 开放 数据 ;不 敢 开 是 担心 数据 开放 会 带 来 安全 风 
险 、 信 息 泄露 等 问题 ,我国 尚未 建成 数据 安全 保障 体系 ,各 部 门 担心 由 数据 
开放 而 导致 信息 泄密 或 者 引发 信息 安全 风险 ;不 会 开 是 指 不 知道 究竟 应 当 
如 何 去 开 放 数据 ,在 实务 中 各 部 门 尚未 建立 起 统一 的 数据 标准 ,对 数据 也 
没有 进行 分 级 管理 制度 ,各 部 门 不 知道 哪些 数据 需要 开放 、 哪 些 数据 需要 
保密 ,也 不 知道 应 当 采 用 何 种 方式 去 开放 ,并 且 担 心 数 据 开 放 后 的 数据 再 
利用 ,数据 二 次 分 析 无 法 控制 .52?2 不 解决 这 些 问 题 ,无论 是 政府 ,社会 行业 
数据 库 , 还 是 侦查 机 关内 部 的 数据 壁垒 现象 都 会 持续 下 去 。 

(二 ) 建立 数据 共享 机 制 

当下 ,大 数据 侦查 机 制 构建 的 当务之急 就 是 要 打破 数据 壁垒 ,促进 侦 
查 机 关 与 政府 、 社 会 行业 数据 库 之 间 的 共享 ,促进 侦查 机 关内 部 数据 库 之 
间 的 共享 。 数 据 共享 机 制 的 建立 ,符合 我 国 大 数据 总 体 战 略 的 基本 部 署 。 
国务 院 ( 促 进 大 数据 发 展 纲要 》 的 核心 内 容 就 是 建立 数据 共享 和 开放 机 制 ， 
强调 要 加 强 数据 的 跨 部 门 . 跨 区 域 共享 ,加 强 政府 数据 与 社会 数据 的 汇聚 


51] 检察 机 关 统 一 业务 应 用 系统 虽然 是 办 案 平 台 , 但 是 其 在 业务 应 用 中 积累 了 大 量 的 案件 
数据 .个 人 信息 数据 ,也 是 资源 庞大 的 数据 库 。 

52] 单 志 广 :《 关 于 促进 大 数据 发 展 行动 纲要 解读 ), 载 新 华 网 http://news. xinhuanet. com/ 
info/2015-09/17/c_134632375. htm, 最 后 访问 时 间 : 2016 年 9 月 30 日 。 
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整合 ,加 强 执法 部 门 之 间 的 数据 流通 .22 数据 开放 共享 也 是 目前 全 世界 大 
数据 发 展 的 普遍 趋势 , 越 来 越 多 的 国家 开始 建设 国家 层面 的 数据 开放 平 
台 。2011 年 在 奥巴马 的 倡导 下 ,还 成 立 了 全 球 性 的 “开放 政府 联盟 "组织 ， 
其 成 员 已 经 从 8 个 国家 发 展 到 66 个 国家 ,主旨 就 是 政府 要 向 民众 开放 更 多 
的 数据 。 目 前 ,我 国 也 有 不 少 政府 部 门 已 经 开始 尝试 建立 统一 数据 开放 平 
台 , 如 北京 市 政府 数据 开放 平台 浙江 省 数据 开放 平台 、 上 海 市 数据 开放 平 
台 等 。 然 而 ,政府 数据 开放 平台 所 开放 的 仅仅 是 与 公民 生活 服务 密切 相关 
的 ,公开 的 数据 ,尽管 可 以 为 侦查 工作 提供 部 分 数据 资源 ,但 目前 还 远 远 达 
不 到 侦查 部 门 数据 共享 机 制 所 需 的 广度 和 深度 。 
笔者 认为 ,大 数据 侦查 中 数据 共享 机 制 的 建设 可 以 从 内 部 和 外 部 两 个 
方面 人 手 。 内 部 是 指 各 侦查 机 关 本 身 要 建立 数据 共享 机 制 , 纵 向 上 要 打破 
各 级 别 侦查 机 关 的 数据 壁垒 ,横向 上 要 打破 不 同 地 域 侦查 机 关 之 间 的 数据 
壁垒 ; 外 部 是 指 侦查 机 关 与 政府 ,社会 行业 建立 数据 共享 机 制 。 
(1) 侦查 机 关内 部 的 数据 共享 机 制 。 侦 查 机 关内 部 的 大 数据 共享 机 制 
建设 可 以 从 纵向 和 横向 两 个 方面 人手 。 从 纵向 角度 来 说 ,要 打破 不 同 级 别 
之 间 的 数据 限制 .《 促 进 大 数据 发 展 纲要 》 中 提出 政府 部 门 要 在 地 市 级 以 
上 政府 构建 统一 的 数据 应 用 平台 ,侦查 机 关 也 可 以 参照 此 机 制 建设 : 建立 
一 个 全 国 层面 的 总 数据 中 心 ,可 以 由 公安 部 、 高 检 院 来 负责 ,统筹 管理 全 国 
各 地 侦查 数据 ;各 省 级 侦查 部 门 分 设 数据 中 心 ,负责 统筹 管理 本 省 的 各 侦 
查 部 门 数据 ;地 市 级 侦查 部 门 也 可 以 单 设 统一 数据 中 心 , 汇 集 管理 本 地 区 
的 侦查 数据 ,但 是 原则 上 基层 侦查 部 门 不 再 另外 设置 数据 中 心 ,而 是 共享 
上 级 的 数据 平台 。 例 如 高 检 院 所 建立 的 “检察 机 关 统 一 业务 应 用 系统 ”, 就 
在 全 国 范围 内 实现 了 检察 机 关 不 同 权限 的 数据 共享 平台 。 从 横向 角度 来 
说 ,要 打破 不 同 地 域 之 间 的 数据 限制 。 横 向 的 数据 共享 至 少 应 当 达 到 如 下 
程度 : 全 国 层面 的 总 数据 中 心 有 权 限 查询 、 获 取 全 国 各 地 、 各 级 侦查 机 关 的 
数据 ;省 级 的 数据 中 心 有 权限 查询 获取 全 省 管辖 范 围 内 各 地 的 侦查 数据 ; 


51] 《国务 院 关 于 印发 促进 大 数据 发 展 行动 纲要 的 通知 》, 国 发 [2015]50 号 
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地 市 级 侦查 部 门 包括 其 管辖 的 各 基层 侦查 部 门 有 权限 查询 .获取 本 市 的 侦 
查 数据 ,原则 上 地 市 级 层面 不 再 设 数据 壁垒 ,所 有 数据 库 全 市 各 侦查 部 门 
共享 。 另 外 ,在 现 有 基础 上 ,对 于 一 些 重要 的 、 基 础 的 数据 库 应 当 继续 在 全 
国 、 省 级 范围 内 推广 其 共享 应 用 ;全 国 省 级 侦查 部 门 之 间 、 同 一 省 份 的 不 同 
地 市 级 侦查 部 门 之 间 应 当 建 立 数据 共享 .查询 渠道 。 

(2) 侦查 机 关外 部 的 数据 共享 机 制 。 侦 查 部 门 还 应 当 与 一 些 对 于 侦查 
工作 有 密切 联系 的 社会 数据 库 建 立 共 享 机 制 , 如 工商 .税务 .银行 .通讯 、 房 
地 产 \ 车 辆 证券 .股票 .电力 、 网 络 、 医 疗 、 社 保 、 物 流 等 行业 的 数据 库 。 当 
前 ,数据 共享 建设 还 面临 着 如 何 共享 、 多 大 程度 上 共享 .数据 标 准 不 统一 等 
问题 ,侦查 机 关 与 外 部 社会 行业 的 数据 共享 将 会 是 一 个 逐渐 推进 的 过 程 。 
在 当前 阶段 ,侦查 机 关 可 以 通过 与 相关 行业 签署 共 建 协议 ,合作 协议 等 方 
式 ,通过 开放 接口 或 拷贝 的 形式 获取 进入 社会 数据 库 的 部 分 权限 。 例 如 
2015 年 11 月 ,浙江 省 高 级 人 民法 院 与 阿里 巴巴 公司 签署 数据 合作 协议 , 浙 
江 省 高 院 将 享有 阿里 巴巴 用 户 的 身份 地 址 数据 、 消 费 数据 、 金 融 数据 等 ,并 
将 之 用 于 送 达 ,冻结 等 司法 程序 。"" 

数据 的 开放 、 共 享 机 制 固然 能 够 为 侦查 工作 带 来 更 多 的 资源 、 线 索 , 提 
高 侦查 效率 ,但 是 过 度 的 数据 共享 则 容易 导致 * 大 数据 监控 ”社会 的 形成 ， 
带 来 社会 民众 心理 的 恐慌 ,不 安定 感 。 一 旦 发 生 泄露 .攻击 等 安全 问题 , 数 
据 的 过 度 集中 也 会 带 来 更 大 的 风险 。 因 此 ,数据 共享 机 制 建设 应 当 也 是 有 
限度 的 ,并 且 要 有 一 定 的 程序 规制 。 这 方面 日 本 就 做 得 很 好 ,日 本 的 (隐私 
法 ) 中 规定 ,政府 在 运用 公民 的 “番号 ”进行 数据 交换 、 共 享 时 ,应 当 有 书面 
文字 合同 ,并 且 通 过 官方 媒介 向 民众 公示 ,以 保障 数据 主体 的 知情 权 。5?7 
我 国 侦查 机 关 在 构建 数据 共享 机 制 时 ,也 应 当 将 这 一 问题 纳入 制度 、 规 则 
的 制定 中 去 ,确保 数据 共享 与 个 人 信息 保护 的 平衡 。 


51] 搜狐 网 :《 浙 江 高 院 与 阿里 合作 法 律 文书 寄 到 淘宝 收 货 地 址 》, 载 搜狐 网 http://news. 
sohu. com/20151124/n427933546. shtml, 最 后 访问 时 间 : 2016 年 9 月 30 日 。 
52] 孙 晓 柳 :《 日 本 (番号 法 探究 ), 载 (长 春 理工 大 学 学 报 》,2014(8) 。 
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二 、 大 数据 侦查 的 技术 应 用 平台 


(一 ) 大 数据 侦查 的 技术 体系 

大 数据 本 身 涉及 数学 、 统 计 学 、 人 工 智 能 ,计算 机 等 多 项 专业 技术 ,各 
个 环节 都 需要 专业 技术 的 支撑 。 大 数据 侦查 的 技术 体系 可 以 分 为 数据 生 
成 ,采集 体系 ,数据 交换 .共享 体系 以 及 数据 分 析 、 应 用 这 三 大 体系 ,并 且 这 
三 大 技术 体系 的 建设 层 层 相 扣 , 缺 一 不 可 。 数 据 的 生成 和 采集 离 不 开 物 联 
网 .自动 识别 等 传 感 技 术 ,数据 的 存储 交换 和 共享 则 离 不 开 云 存储 、` 云 计 
算 和 互联 网 技术 ,数据 的 分 析 则 离 不 开 数 据 挖掘 技术 .可视化 技术 。 

(1) 数据 生成 .采集 体系 。 数 据 生成 .采集 体系 主要 涉及 数据 化 的 过 
程 ,将 人 类 的 各 种 行为 .事物 的 变化 发 展 状态 转化 成 数据 并 记录 下 来 。 数 
据 化 的 能 力 越 强 、 范 围 越 广 ,可 供 分 析 的 数据 源 、 数 据 粒 度 也 就 越 细 。 在 早 
年 往往 通过 人 工 录 入 的 方式 进行 数据 采集 ,然而 在 大 数据 时 代 面 对 如 此 多 
的 数据 量 和 采集 对 象 , 人 工 录入 方式 显然 已 不 再 适应 。 目 前 数据 的 生成 、 
采集 主要 通过 新 一 代 的 传 感 技术 来 完成 的 ,包括 射频 、 二 维 码 、 条 形 码 等 自 
动 识别 技术 。 如 现在 通过 扫描 物品 的 二 维 码 就 能 够 查询 到 它 的 详细 数据 ， 
智能 电表 能 够 实时 反映 居民 电力 使 用 情况 ,智能 手 环 能 够 反映 我 们 的 运动 
健康 数据 ,这 都 是 传 感 技术 的 运用 。 目 前 公安 机 关 也 开始 将 传 感 技 术 用 于 
对 车 辆 .物品 . 居 民 信 息 等 数据 的 采集 中 。 总 之 ,数据 生成 .采集 体系 的 目 
的 就 是 通过 智能 化 技术 实现 ”人 一 数 ”"“ 物 一 数 ” 的 数据 转化 过 程 ,形成 海 
量 的 侦查 数据 源 。 

(2) 数据 交换 、 共 享 体系 。 数 据 交换 、 共 享 体系 主要 完成 数据 传递 的 任 
务 。 在 海量 数据 生成 .采集 的 基础 上 ,需要 完成 数据 传输 以 及 不 同 部 门 之 
间 的 数据 共享 。 这 就 需要 运用 到 网 络 技术 ,只 有 依托 于 互联 网 技术 才能 完 
成 大 批量 、 多 格式 的 数据 传递 。 除 了 我 们 一 般 意 义 上 的 互联 网 外 ,公安 机 
关 还 有 专用 的 网 络 , 包 括 公 安 计算 机 网 、 公 安 卫星 通信 专用 网 、 公 安 视频 通 
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信 网 等 .7 公安 的 专门 网 络 在 基础 设备 .安全 性 及 承载 量 上 都 更 具有 优 
势 ,对 于 一 些 涉 密 的 、 重 要 的 数据 ,应 当 通过 公安 专用 网 络 来 传递 。 另 外 ， 
随 着 物 联网 技术 的 发 展 ,大 数据 侦查 中 的 数据 源 会 越 来 越 多 ,对 此 侦查 机 
关 可 以 使 用 云 存 储 技术 ,通过 将 设备 存储 在 “云端 "来 解决 存储 容量 问题 。 
例如 北京 市 检察 系统 建立 了 “电子 取证 云 平 台 ”, 通 过 云 平台 控制 中 心 在 
“云端 实现 电子 取证 工作 。 不 过 ,尽管 云 存储 有 着 方便 快捷 、 成 本 低廉 的 
优点 ,但 是 风险 性 也 更 高 一 些 , 因 此 要 加 强大 数据 侦查 中 云 存储 的 安全 性 
功能 建设 ,通过 加 密 等 技术 来 保证 数据 的 机 密 性 、 完 整 性 和 可 用 性 .52” 

(3) 数据 分 析 、 应 用 体系 。 数 据 分 析 、 应 用 体系 是 对 已 采集 传输、 存储 
的 数据 进行 分 析 的 过 程 。 主 要 包括 数据 清洗 、 数 据 预 处 理 技术 、 数 据 挖掘 
技术 以 及 大 数据 可 视 化 技术 等 。 其 中 ,关联 性 分 析 、 回 归 分 析 、 异 常 分 析 等 
数据 挖掘 技术 是 今后 大 数据 侦查 体系 构建 中 需要 重点 突破 的 技术 。 另 外 ， 
大 数据 的 速度 快 、 容 量 大 、 结 构 多 样 等 特征 为 数据 分 析 技术 带 来 了 新 的 挑 
战 , 大 数据 处 理 技术 必须 能 够 应 对 PB、ZB 级 别 的 数据 ,能 够 对 非 结 构 化 数 
据 进行 分 析 ,能 够 支持 对 实时 数据 流 的 处 理 。 在 专业 领域 内 ,很 多 技术 人 
员 提出 通过 Hadoop .MapReduce"3) 等 分 布 式 计算 框架 来 对 大 数据 进行 分 
析 。 大 数据 可 视 化 技术 也 是 目前 大 数据 的 重点 研究 领域 。 可 视 化 技术 能 
够 根据 不 同 的 任务 需求 将 数据 分 析 结 果 以 形象 直观 的 图 像 展 现 出 来 , 比 
我 们 传统 所 接触 的 饼 图 、 折 线 图 、 条 状 图 等 简单 的 图 表 要 立体 、 生 动 得 多 ， 
甚至 具有 一 定 的 艺术 性 和 美感 ,有 利于 分 析 人 员 对 数据 结果 的 深度 分 析 ， 
也 有 利于 侦查 决策 的 高 效 化 。 

此 外 ,还 应 当 将 个 人 信息 保护 及 信息 安全 纳入 大 数据 侦查 技术 体系 构 
建 中 。 如 通过 数据 脱 敏 技术 数据 加 密 技 术 、 数 据 失 真 等 技术 来 保护 隐私 


51] 张 兆 端 :《 智 慧 公 安 : 大 数据 时 代 的 警 务 模式 》,46 页 ,北京 ,中 国人 民 公 安 大 学 出 版 社 ， 
2015 。 

52] 傅 颖 勋 , 罗 圣 美 .每 继武 :《 安 全 云 存 储 系统 与 关键 技术 综述 ), 载 (计算 机 研究 与 发 展 》， 
2013(1) 。 

53] Hadoop、MapReduce 都 是 分 布 式 计算 技术 ,能 够 同时 进行 多 任务 的 数据 处 理工 作 , 实 现 
对 非 结构 化 数据 的 处 理 。 
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信息 ;通过 数据 匿名 技术 来 保护 数据 主体 的 身份 ;通过 数据 容 灾 备份 数据 
校 验 等 技术 来 保障 数据 安全 和 网 络 安全 。 其 中 ,数据 脱 敏 技术 近来 为 很 多 
领域 所 青睐 , 它 仅 仅 改 变数 据 中 的 敏感 部 分 信息 ,而 保留 了 数据 中 其 他 信 
息 的 真实 性 和 完整 性 ,从 而 有 效 地 兼顾 了 信息 处 理 和 隐私 保护 两 方面 的 价 
值 平 衡 。:” 当然 ,也 有 一 些 前 沿 的 学 者 认为 即便 是 脱 敏 技术 在 大 数据 时 代 
也 会 失效 ,数据 挖掘 技术 能 够 很 快 地 将 匿名 信息 指向 对 应 的 个 人 。 但 无 论 
如 何 , 在 大 数据 侦查 机 制 建设 过 程 中 ,都 要 注意 将 个 人 信息 保护 技术 、 数 据 
安全 保护 技术 吸收 进来 。( 见 表 6-1) 


表 6-1 大 数据 侦查 技术 体系 




















大 数据 侦查 体系 相关 技术 目标 任务 
数据 搜索 ;数据 磁 擅 ;关联 分 析 、 聚 类 分 | | 

数据 分 析 、 应 用 | 析 , 决 策 衬 ,神经 网 络 、 回 归 分 析 等 数据 | 全 台所 归 更 罕 

体系 挖掘 技术 ; Hadoop、MapReduce 等 分 布 任务 二 
式 计算 技术 

数据 交换 ,共享 | 互联 网 技术 ,公安 专用 网 技术 ; 云 存 储 | 完成 数据 传输 、 数 据 共 

体系 技术 享 任务 

数据 生成 采集 i 完成 “人 一 数 "“ 物 

体系 人 数 "的 数据 化 过 程 

脱 僻 技术 加 密 技术 匿名 技术 \ 失 真 技 | 数据 隐私 及 数据 安全 保 
数据 安全 体系 。 | 术 数据 隔离 . 容 灾 备 份 等 技术 护 任务 


(二 ) 大 数据 侦查 的 应 用 平台 

侦查 机 关 应 当 构建 统一 .综合 的 数据 应 用 平台 。 不 过 需要 注意 的 是 ， 
侦查 大 数据 应 用 平台 并 非 是 像 目 前 我 国有 些 政府 部 门 的 数据 开放 平台 一 
样 ,作为 一 个 “数据 集散 地 ”, 仅 有 数据 汇集 ,查询 等 简单 的 功能 。 侦 查 机 关 
的 数据 应 用 平台 应 当 是 集 数 据 存储 、 数 据 清 洗 、 数 据 分 析 、 数 据 可 视 化 等 功 
能 为 一 体 的 综合 数据 应 用 平台 ,尤其 要 加 强 数据 挖掘 功能 、 侦 查 信 息 的 智 
能 研判 功能 ,为 侦查 工作 提供 决策 依据 。 在 数据 综合 应 用 平台 上 ,根据 不 


51] 郭 嘉 凯 :《 数 据 脱 敏 : 敏感 数据 的 安全 卫士 ), 载 (软件 和 信息 服务 》,2014(2) 。 
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同 的 工作 任务 ,可 以 在 海量 侦查 数据 源 基 础 上 开发 出 不 同 的 应 用 功能 ,如 
犯罪 预测 应 用 、 犯 罪 热 点 应 用 、 数 据 碰 撞 应 用 、 高 危 犯罪 和 人群 预测 等 不 同 的 
应 用 系统 。 

与 此 同时 ,数据 应 用 平台 的 建设 可 以 与 数据 共享 制度 相对 接 。 分 别 建 
立 全 国 统一 的 大 数据 侦查 应 用 平台 ,各 省 、 直 辖 市 的 大 数据 侦查 应 用 平台 ， 
各 地 级 市 的 大 数据 侦查 应 用 平台 ,集中 资源 优化 配置 ,打通 大 数据 平台 之 
间 的 壁 又 。 实 务 中 也 已 经 有 很 多 侦查 机 关 开始 构建 大 数据 应 用 平台 。 某 
市 公安 局 开发 的 “ 警 务 信 息 协 作 实 体 平台 ”, 能 实现 多 个 地 区 的 信息 交互 共 
享 ,将 重点 人 员 信 息 、 关 注 人 员 信 息 、 高 危 车 辆 信息 、 动 态 活动 信息 、 社 会 资 
源 信息 .预警 信息 ,布控 信息 、 通 讯 信息 等 整合 至 同一 数据 库 , 实 现 数据 综 
合 查 询 分 析 、 案 件 串 并 分 析 等 多 种 功能 ,对 于 跨 地 区 流窜 作案 、 团 伙 作 案 具 
有 很 明显 的 打击 效果 ; 某 市 检察 院 的 大 数据 平台 将 实时 数据 、 既 往 数 据 、 找 
贝 数据 互联 网 数据 等 汇集 成 巨大 的 数据 资源 池 , 在 此 基础 上 建立 大 数据 
分 析 应 用 平台 ,支持 一 键 式 查询 .批量 查询 和 关联 搜索 ,能 够 实现 对 数据 的 
清洗 和 数据 格式 的 统一 ,并 对 嫌疑 人 、 涉 案 公 司 企业 进行 智能 化 分 析 研 判 ， 
为 案件 侦查 提供 决策 依据 。 其 实 无 论 采取 哪 种 形式 ,建立 数据 应 用 平台 的 
核心 就 在 于 集 数据 存储 、 数 据 处 理 等 多 种 功能 为 一 体 ,尤其 是 要 突出 数据 
挖掘 .分 析 研 判 和 数据 决策 功能 。 


三 、 大 数据 侦查 的 第 三 方 行业 规范 


(一 ) 制定 行业 规范 的 必要 性 

这 里 的 第 三 方 行业 规范 主要 是 指 大 数据 公司 的 行业 规范 。 上 文 提 到 
大 数据 公司 调 取 数据 是 大 数据 侦查 的 重要 方法 之 一 ,实际 上 大 数据 公司 不 
仅仅 在 大 数据 侦查 制度 中 具有 重要 地 位 ,也 是 整个 国家 大 数据 发 展 战略 的 
先驱 者 。 大 数据 公司 所 掌握 的 海量 数据 是 任何 一 个 政府 部 门 、 企 业 单 位 都 
无 法 企及 的 。 例 如 阿里 巴巴 公司 2008 年 就 将 大 数据 作为 公司 的 基本 战 
略 , 经 过 近 十 年 的 发 展 , 已 经 累积 了 海量 的 客户 数据 .商品 数据 等 ,甚至 有 
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言论 认为 阿里 巴巴 的 大 数据 关系 到 整个 国家 安全 ;" ?腾讯 公司 掌握 全 国 最 
大 的 社交 数据 ;百度 公司 则 掌握 着 全 国 大 部 分 网 民 的 搜索 行为 数据 。 鉴 于 
大 数据 公司 拥有 的 数据 资源 , 越 来 越 多 的 政府 部 门 、 企 事业 单位 开始 寻求 
与 大 数据 公司 的 合作 。 侦 查 部 门 也 不 例外 ,无 论 是 个 案 侦查 中 的 数据 调 
取 , 还 是 建立 长 期 数据 共享 合作 战略 ,都 离 不 开 大 数据 公司 的 协助 。 因 此 ， 
大 数据 侦查 制度 的 构建 必然 离 不 开 对 大 数据 公司 的 行业 规制 ,不 仅仅 包括 
公司 内 部 的 大 数据 管理 制度 ,更 是 基于 数据 开放 、 共 享 基础 上 如 何 与 侦查 
机 关 调 取 数 据 行为 进行 衔接 的 程序 规制 。 大 数据 公司 应 当 在 既 有 相关 法 
律 规定 基础 上 制定 统一 行业 规范 。 

目前 ,大 数据 公司 面 对 纷 至 省 来 的 数据 调 取 需求 , 吸 须 相关 的 数据 行 
业 规 范 。 尽 管 在 司法 程序 中 ,大 数据 公司 负 有 协助 取证 的 义务 ,但 是 并 不 
意味 着 各 机 关 可 以 不 受 约束 随意 调 取 数据 。 但 是 , 据 我 国 大 数据 公司 相关 
工作 人 员 反 映 , 他 们 在 实务 中 面 对 各 部 门 纷 至 省 来 的 数据 调 取 需求 往往 无 
所 适 从 ,能 够 提供 哪些 数据 类 型 .如 何 提 供 数 据 等 目前 都 无 法 可 依 。 归 纳 
起 来 ,主要 存在 以 下 一 些 问 题 不 同 主体 调 取 权 限 没有 区 分 。 实 务 中 不 
仅仅 只 有 侦查 机 关 向 大 数据 公司 调 取 数 据 , 行 政 机 关 人 员 乃 至 诉讼 当事人 
都 有 调 取 数 据 的 需求 。 不 同 程序 中 不 同 主体 调 取 数据 的 权限 应 当 有 所 区 
分 。 名 数据 内 容 没 有 区 分 。 这 也 是 目前 大 数据 公司 协助 调 取 数据 中 存在 
的 最 大 问题 。 不 同类 型 的 个 人 数据 私密 程度 是 有 区 分 的 ,有 些 数据 是 具有 
私密 性 的 、 甚 至 是 敏感 的 ,例如 聊天 记录 、 电 子 邮 件 、 个 人 健康 数据 等 ,有 些 
数据 则 具有 公开 性 ,例如 在 社交 平台 转发 的 文章 、 图 片 等 。 尽 管 也 有 一 些 
法 律 会 对 不 同 数据 的 调 取 权限 进行 规定 ,"*? 但 随 着 新 数据 的 层出不穷 ,新 
的 问题 也 会 不 断 产生 ,例如 法 院 是 否 有 调 取 电 子 邮 件 的 权限 ?对 于 即时 通 


C1] 刘 太 刚 :《 阿 里 巴巴 的 大 数据 有 多 可 怕 ?), 载 中 国 金融 信息 网 http://life. xinhua08. 
com/a/20141010/1395787. shtml, 最 后 访问 时 间 : 2016 年 9 月 30 日 。 

52] 如 《互联 网 电子 邮件 服务 管理 办 法 ) 第 2 条 规定 ,对 于 公民 的 电子 邮件 ,只 有 公安 机 关 或 
者 检察 机 关 因 国家 安全 或 者 追查 刑事 犯罪 的 需要 ,并 且 依 照 法 律 规定 的 程序 才 有 权 进 行 检查 ,其 他 
任何 组 织 或 者 个 人 都 无 权 检查 。 
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讯 数据 是 否 需要 采取 与 电子 邮件 相同 的 保护 ? 当事人 有 权 调 取 自 己 的 数 
据 吗 ?可 见 , 既 有 相关 法 律 规定 所 起 的 作用 也 是 有 限 的 ,具体 的 数据 内 容 
管理 只 能 留待 行业 自行 规定 。@ 调 取 程 序 没 有 统一 。 目 前 ,大 数据 公司 的 
数据 调 取 还 存在 以 下 乱 象 : 不 同 大 数据 公司 所 要 求 的 调 取 手续 、 相 关 法 律 
文书 不 尽 相 同 (例如 有 些 公 司 需 要 介绍 信 , 有 些 需 要 立案 通知 书 等 ); 司 法 
机 关 要 求 调 取 的 数据 范围 往往 过 于 宽泛 ;一 般 来 说 ,外 地 司法 机 关 调 取 数 
据 都 需要 大 数据 公司 所 在 地 的 对 应 司法 机 关 协 助 、 对 接 , 程 序 烦琐 ,也 影响 
了 取证 的 效率 。 大 数据 公司 作为 数据 管理 者 , 面 对 实 务 中 日 趋 增多 的 调 取 
数据 需要 , 面 对 多 元 化 的 取证 主体 及 不 同 的 取证 程序 , 吸 须 相关 的 行业 规 
范 指导 。 如 何 去 对 接 公 权力 机 关 调 取 数 据 与 大 数据 公司 管理 数据 之 间 的 
程序 性 规定 ,也 是 实务 中 切实 面临 的 问题 ." 

(二 ) 数据 管理 的 行业 规范 

本 节 的 数据 管理 主要 探讨 大 数据 公司 对 用 户 数 据 进行 分 级 、 分 类 管 
理 ,这 里 的 用 户 数据 主要 以 个 人 信息 为 主 ."*? 个 人 信息 分 类 历来 有 多 种 标 
准 。 个 人 信息 保护 法 将 其 分 为 一 般 信息 和 敏感 信息 ,个 人 敏感 信息 具有 极 
强 的 私密 性 ,一 般 情况 下 个 人 不 愿意 向 他 人 透露 ,如 种 族 血统 、 宗 教 信息 、 
政治 观点 健康 与 性 生活 等 相关 信息 ."3 不 过 越 来 越 多 的 观点 开始 认为 ， 
仅 对 个 人 数据 做 敏感 和 非 敏感 区 分 还 是 不 够 细 化 ,敏感 数据 涉及 的 是 个 人 
信息 中 最 为 私密 的 一 部 分 信息 ,而 非 敏感 信息 中 也 包含 有 大 量 的 隐私 数 
据 , 尤 其 是 在 大 数据 时 代 通 过 数据 的 聚合 就 可 以 挖掘 出 很 多 涉及 个 人 隐私 
的 信息 ,因而 传统 的 二 分 法 或 许 已 经 难 再 满足 现实 需求 。 有 学 者 按照 个 人 
信息 的 重要 程度 ,将 其 分 为 个 人 一 般 信息 、 个 人 重要 信息 、 个 人 关键 信 


51] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学报 》,2015(5) 。 
52] 大 数据 时 代 , 数 据 种 类 层出不穷 ,固然 不 是 用 户 数据 /个 人 信息 就 可 以 襄 括 的 ,例如 在 物 
联网 技术 下 所 产生 的 “ 物 的 数据 ”如 何 管理 分 配 就 是 难题 。 本 文 之 所 以 以 用 户 数据 为 主要 规制 对 
象 ,是 因为 在 大 数据 侦查 中 以 及 其 他 司法 机 关 调 取 数 据 过 程 中 ,基本 都 是 以 用 户 的 个 人 数据 为 主 。 
53] 《信息 安全 技术 公共 及 商用 服务 信息 系统 个 人 信息 保护 指南 ) 第 3.7 条 。 
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息 ; 5 还 有 学 者 将 个 人 信息 分 为 个 人 身份 信息 、 敏 感 信息 、 准 标识 符 信息 、 
日 志 信息 和 公开 信息 等 .2 

尽管 上 述 几 种 方法 对 数据 的 分 级 .分 类 都 不 相同 ,但 是 基本 上 都 是 围 
绕 数 据 隐 私 程度 这 一 核心 标准 来 进行 划分 的 。 本 文 也 将 以 数据 的 隐私 性 
作为 分 级 分 类 的 标准 ,结合 大 数据 公司 的 数据 类 型 .数据 特征 来 对 各 类 数 
据 的 私密 程度 进行 划分 "3 (如 表 6-2) 


表 6-2 大 数据 公司 数据 分 级 分 类 制度 设计 








数据 类 型 公开 范围 ”| 私密 等 级 
敏感 身份 信息 
如 账号 密码 ,宗教 信仰 基因 、| 入 品 人 在 到 于 | 私密 
健康 及 性 生活 等 信息 

身份 信息 
一 般 身份 信息 自己 ,大 数据 公 


如 住址 、 职 业 、 兴 趣 爱 好 等 (用 | 司 及 部 分 公众 | 半 公 开 
户 可 以 自行 设置 公开 范围 ) 可 见 

二 和 位 内 容 | 自己 及 大 数据 
前 启 扣 由 聊天 内 容 、 邮 件 内 容 、 私 信和 内容 公司 可 见 私密 
的 数据 所 有 人 可 见 公开 


用 户 存 | 存储 ,发 布 的 信息 ,如 在 平台 上 | 自己 大 数据 公 | 
储 、 提 供 | 传 照片 .发布 的 日 记 、 文 字 等 | 司 及 部 分 公众 | 半 公 开 
的 信息 “| (用 户 可 以 自行 设置 公开 范围 ) | 可 见 

自己 及 大 数据 | 特定 对 象 
公司 可 见 公开 

交易 行为 ,如 通过 大 数据 公司 | 自己 及 大 数据 | 特定 对 象 
所 进行 的 网 络 购物 .消费 内 容 | 公司 可 见 公开 
































51] 史 卫 民 :《 大 数据 时 代 个 人 信息 保护 的 现实 困境 与 路 径 选择 )》, 载 (情报 杂志 》,2013(12) 。 

52] 刘 雅 辉 . 张 铁 赢 . 靳 小 龙 , 程 学 旗 :《 大 数据 时 代 的 个 人 隐私 保护 》, 载 (计算 机 研究 与 发 
展 》,2015(1) 。 

53] 这 里 的 数据 主要 以 我 国 互联 网 大 数据 公司 “隐私 政策 "中 所 提供 的 数据 为 参照 。 
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续 表 
数据 类 型 公开 范围 “| 私密 等 级 
搜索 或 浏览 的 信息 , 软 硬 件 信 Re 
息 ,如 使 用 的 网 页 搜索 词语 . 访 | 六 起 颖 公司 | 特定 对 银 
问 的 页 面 地 址 等 
在 移动 设备 上 使 用 的 移动 应 用 | 自己 及 大 数据 | 特定 对 象 
CAPP) 和 其 他 软件 的 信息 。 | 公司 可 见 公开 
日 志 信息 | 通过 大 数据 公司 服务 进行 通讯 
的 信息 ,如 通讯 的 账号 .通讯 时 | 腿 己 及 大 数据 | 特定 对象 
间 数 据 和 时 长 等 人 人 AS 天 
通过 大 数据 公司 上 传 内 容 所 包 时 
ge 信 的 元 数据 ,如 上 传 照 片 的 日 | 自 芝 六 数据 | 各 定 对象 
人 期 .时 间或 地 点 等 > 
数据 通过 具有 定位 功能 的 移动 设备 | 大 数据 公司 | 特定 对 象 
收集 的 地 理 位 置信 息 可 见 公开 
用 户 提供 的 包含 所 处 地 理 位 轩 
jw | 的 信息 ,如 账户 信息 中 包含 的 
位 置信 息 1 
位 置信 息 | 所 在 地 区 信息 ,用 户 或 其 他 人 ed 
上 传 的 显示 所 处 地 再 位 置 的 共 | 信众 可 见 | 、 
享 信息 ,用 户 或 其 他 人 共享 的 | 公 
照片 包含 的 地 理 标记 信息 等 
社交 信息 | 社交 平台 上 的 相关 信息 ,如 联 全 特定 对 象 
一 人 | 系 人 、 亲 密度 .朋友 关系 等 闪闪 6、 “| 次 区 














表 6-2 中 的 “数据 类 型 > 是 指 大 数据 公司 所 掌握 的 用 户 数据 类 型 ,包括 
身份 信息 .用户 存储 信息 .日志 信息 、 位 置信 息 等 “公开 范围 > 是 结合 数据 
本 身 的 特征 来 确定 某 类 数据 的 可 见 范围 ,例如 “邮件 内 容 、 即 时 通讯 内 容 ” 
这 部 分 数据 只 有 用 户 本 人 和 大 数据 公司 后 台 可 见 , 青 如 大 数据 公司 自行 收 
集 的 “搜索 或 浏览 的 信息 ”一 般 是 大 数据 公司 后 台 可 见 。“ 私 密 等 级 "是 结 
合 各 种 数据 的 特征 ,对 数据 隐私 程度 所 进行 的 划分 ,也 是 本 文中 数据 分 级 
最 核心 的 内 容 一 一 私密 ?是 隐私 程度 最 高 的 信息 ,如 敏感 的 个 人 数据 ( 基 
因 、 宗 教 、 信 仰 等 )、 通 信 数 据 ( 聊 天 内 容 、 私 信和 内容、 邮件 内 容 等 );“ 特 定 对 
象 公开 的 信息 ”一 般 仅 有 用 户 本 人 及 大 数据 公司 后 台 可 见 ,这 些 信息 一 般 
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与 个 人 隐私 联系 较为 密切 ,但 不 如 私密 数据 的 隐私 性 高 ;“ 半 公开 信息 ” 主 
要 是 用 户 基 于 自愿 ,在 一 定 范围 内 所 发 布 的 信息 ,由 于 公开 范围 的 有 限 性 ， 
仍然 具有 一 定 的 隐私 性 ; “公开 信息 ”是 指 用 户 自愿 对 公众 公开 的 信息 ,这 
些 数据 不 再 属于 隐私 的 范畴 ,如 微 博 平台 发 布 的 所 有 人 可 见 信 息 ."' 在 数 
据 分 类 分 级 的 基础 上 ,大 数据 公司 应 当 对 不 同 级 别 的 数据 制定 不 同 的 管理 
制度 ,对 于 私密 程度 较 高 的 数据 偏重 于 数据 的 保护 ,而 对 数据 的 流通 和 利 
用 进行 一 定 限制 ;对 于 私密 程度 较 低 的 数据 则 保护 力度 较 轻 ,主要 侧重 于 
数据 的 流通 和 利用 。?” 

(三 ) 数据 调 取 的 行业 规范 

这 里 的 数据 调 取 行业 规范 ,是 指 对 司法 程序 中 公 权 力 机 关 等 第 三 方 调 
取 数 据 的 行为 进行 程序 上 规制 .3 当然 ,大 数据 公司 所 制定 的 行业 规范 并 
不 具有 法 律 强 制 效 力 , 仅 仅 是 在 相关 法 律 法 规 基础 上 ,对 本 行业 的 数据 管 
理 以 及 对 第 三 方 调 取 数 据 的 需求 进行 衔接 性 规制 。 

在 数据 分 级 分 类 管理 的 基础 上 ,大 数据 公司 可 以 将 数据 的 分 级 管理 与 
司法 机 关 等 第 三 方 调 取 数据 的 程序 进行 对 接 。 不 同 私密 程度 的 数据 对 应 
不 同 主体 调 取 数据 的 程序 。 具 体 而 言 : 对 于 私密 数据 ,只 能 由 公安 机 关 、 
检察 机 关 、 国 家 安全 机 关 、 军 队 保 卫 部 门 等 基于 打击 犯罪 的 需要 获取 ;或 者 
是 人 民法 院 根据 调查 取证 权 而 获取 (包括 民事 ,刑事 ,行政 诉讼 ) ,但 是 在 民 
事 诉讼 和 行政 诉讼 中 ,基于 数据 主体 的 知情 权 , 法 院 调 取 此 类 数据 应 告知 
数据 主体 。 刑 事 诉 讼 中 ,辩护 律师 确 有 必要 调 取 此 类 证 据 的 , 若 属于 当 事 
人 本 人 所 有 的 ,基于 数据 主体 对 个 人 信息 的 控制 权 , 大 数据 公司 应 当 准许 ; 
若是 属于 其 他 人 的 相关 数据 ,可 以 申请 检察 机 关 、 人 民法 院 调 取 。 民 事 、 行 








51] 本文 提供 的 仅 是 一 个 大 致 粗略 的 数据 划分 参考 ,现实 中 “公开 范围 "可 能 会 有 变动 ,数据 
的 私密 程度 也 会 因为 个 体 评价 的 不 同 而 有 所 区 分 。 

[2] 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 》, 载 (山东 警察 学 院 学报 》,2015(5) 。 

53] 本 文 在 此 将 侦查 机 关 调 取 数 据 的 规制 纳入 公 权 力 机 关 等 第 三 方 调 取 数据 的 统一 程序 规 
制 中 。 因 为 在 大 数据 公司 协助 调 取 数据 的 实务 中 ,侦查 机 关 调 取 数 据 仅 仅 是 业务 的 一 部 分 ,考虑 到 
数据 分 级 管理 与 数据 调 取 程序 衔接 的 复杂 性 与 整体 性 ,本 文 还 是 对 大 数据 公司 协助 调 取 数据 的 整 
体 程序 进行 规范 。 
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政 诉讼 中 ,当事人 及 代理 人 确 有 必要 调 取 时 , 若 属 于 当事人 本 人 所 有 的 ,应 
当 准 许 ;若是 属于 其 他 人 的 相关 数据 ,可 以 申请 法 院 调 取 。@@ 对 于 特定 对 
象 公开 数 据 、 半 公开 数据 , 公 、 检 、 法 机 关 可 以 基于 司法 职权 来 调 取 ,但 是 在 
民事 诉讼 和 行政 诉讼 中 ,法 院 调 取 此 类 数据 应 告知 数据 主体 。 刑 事 诉讼 中 
辩护 律师 调 取 此 类 数据 , 若 属 于 当事人 本 人 所 有 的 ,大 数据 公司 应 当 准许 ， 
若是 属于 其 他 人 的 相关 数据 ,辩护 律师 应 当 提 供 相 应 的 申请 说 明 及 调 取 范 
围 ,并 征 得 数据 所 有 人 明示 同意 方 可 调 取 ; 民 事 诉讼 、. 行 政 诉 讼 中 的 当事人 
及 诉讼 代理 人 调 取 此 类 数据 同 理 。@ 对 于 公开 数据 ,通过 公开 途径 即 可 调 
取 ( 参 见 表 6-3) 。 


表 6-3 数据 分 级 管理 与 数据 调 取 程序 衔接 











调 取 程序 及 主体 机 特定 对 象 公开 数据 ，[ ， 
数据 类 型 we 半 公 开 数 据 A 
国家 安全 机 关 ， 
公安 机 关 、 检 察 | 可 以 调 取 可 以 调 取 
机 关 、 法 院 
，， ，，，。 | 若 局 于 当事人 本 人 所 有 
刑事 诉讼 导向 这 注 记 入 | 的 ,应 当 准许 ,若是 属于 
犯罪 嫌疑 人 及 | 和 小 应 “和 | 其 他 人 的 数据 ,辩护 律 
辩护 人 是 属于 其 他 人 的 数 | 师 应 当 提 供 相应 的 申请 
据 ,可 以 申请 检察 机 


说 明 及 调 取 范 围 , 并 征 | ， 

得 数据 主体 明示 同意 “| 公 开 途 
和 径 , 和 可 

可 以 调 取 , 但 应 征 得 | 可 以 调 取 , 但 应 告知 数 | ， 

法 院 调 取 

数据 主体 同意 据 主体 

当事人 及 代理 人 确 | 若 属于 当事人 本 人 所 有 
事 诉 有 必要 调 取 时 , 若 属 ee 

讼 ,行政 于 当事人 本 人 所 有 的 ,应 当 准 许 ;若是 属于 
和 当事人 及 其 代 | 的 ,应当 淮 诉 ` 若 是 | 其 他 人 的 数据 ,应 当 提 

理 人 供 相应 的 申请 说 明 及 调 


属于 其 他 人 的 相关 | 
数据 ,可 以 申请 法 院 | 到 范围 ,并 征 得 数据 主 
体 明 示 同 意 


调 取 


关 、 人 民法 院 调 取 




















此 外 ,大 数据 公司 还 可 以 构建 专门 的 行业 规范 ,以 规范 司法 机 关 等 第 
三 方 调 取 数据 的 行为 。 例 如 可 以 借鉴 在 协助 调查 取证 方面 做 法 成 熟 的 金 
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融 机 构 ,制定 大 数据 公司 协助 调 取 数据 的 行业 规范 。"1 具体 包括 以 下 几 个 
方面 。 

(1) 专人 负责 。 有 条 件 的 大 数据 公司 应 当 设 立 专 门 的 数据 管理 部 门 ， 
并 安排 专人 负责 协助 司法 机 关 等 第 三 方 调 取 数据 事宜 ,由 首席 数据 执行 官 
(Chief Data Officer) 进行 统筹 管理 。 例 如 2016 年 4 月 14 日 欧盟 刚刚 通过 
的 《数据 保护 一 般 条 例 》 和 《 涉 警 务 司 法 目的 数据 交换 指令 》 中 ,就 规定 公司 
在 处 理 大 量 敏感 数据 的 时 候 必须 指定 专人 担任 数据 保护 专员 (Data 
Protection Officer) 521 再 如 我 国 的 腾讯 公司 设 有 “安全 管理 部 ”, 其 下 安 
排 了 专门 人 员 负 责 协 助 司法 机 关 , 行 政 机 关 的 数据 调 取 工作 。 

(2) 审查 原则 。 对 于 司法 机 关 等 第 三 方 调 取 数据 的 申请 ,大 数据 公司 
应 当 进行 形式 审查 ,审查 内 容 包括 执法 人 员 的 身份 信息 ,相关 的 法 律 文书 ， 
以 及 申请 调 取 的 数据 范围 ,数据 内 容 等 。 对 于 不 符合 形式 要 求 的 调 取 申 
请 ,应 当 通知 有 关 单 位 及 时 补正 。 

(3) 登记 记录 。 大 数据 公司 相关 工作 人 员 对 每 次 的 数据 调 取 申请 及 调 
取 过 程 都 应 当 进 行 记录 ,包括 调 取 单位 名 称 、 执 法 人 员 的 身份 信息 , 调 取 的 
时 间 , 调 取 的 数据 内 容 、 范 围 等 。 当 前 ,一 些 大 数据 公司 开始 运用 专业 的 数 
据 调 取 平台 ,所 有 的 数据 调 取 工作 都 在 平台 上 完成 ,平台 能 够 自动 记录 、 保 
存 每 一 位 登录 人 员 的 身份 信息 和 每 一 操作 步 又 。 

(4) 协助 义务 。 对 于 符合 要 求 的 调 取 数据 申请 ,大 数据 公司 应 当 提 供 
进一步 的 技术 上 协助 ,对 于 采取 何 种 技术 对 数据 进行 检索 ,提取 ,对 于 调 取 
结果 以 何 种 形式 呈现 ,可 以 结合 行业 的 发 展 情况 决定 。 此 外 ,对 于 符合 要 
求 的 调 取 数据 申请 ,大 数据 公司 相关 工作 人 员 应 当 尽 快 、 及 时 协助 取证 , 保 
证 获取 数据 的 准确 .完整 .适时 ,对 于 技术 上 无 法 调 取 的 数据 或 者 超出 法 定 


51] 金融 机 构 在 协助 查询 、 冻 结 、 扣 划 等 方面 已 有 相关 的 行业 管理 规定 ,如 2002 年 中 央 人 民 
银行 发 布 的 (金融 机 构 协 助 查询 .冻结 、 扣 划 工 作 管理 规定 );2014 年 中 国 银监会 .最 高 人 民 检 察 院 、 
公安 部 .国家 安全 部 联合 发 布 的 (银行 业 金 融 机 构 协 助人 民 检 察 院 公安 机 关 国 家 安全 机 关 查 询 冻结 
工作 规定 ) 等 。 

52] 腾讯 研究 院 犯 罪 研究 中 心 :《 欧 盟 新 一 代数 据 保 护 规则 意味 着 什么 兴 非 出 版 物 ) ,北京 腾 
讯 ,2016 。 
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范围 无 法 调 取 的 数据 应 当 及 时 说 明 原因 。 

(5) 责任 机 制 。 大 数据 公司 相关 工作 人 员 应 当 按照 法 律 规定 及 行业 规 
范 协 助 司法 机 关 等 第 三 方 调 取 数据 ,对 数据 调 取 中 获取 的 国家 秘密 、 个 人 
隐私 及 商业 秘密 要 予以 保密 。 对 于 故意 不 履行 协助 义务 ,违规 调 取 数据 ， 
伪造 .隐匿 数据 ,泄露 国家 秘密 等 行为 应 当 予 以 处 分 ,构成 犯罪 的 则 移交 司 
法 机 关 处 理 。 

(6) 收费 制度 。 大 数据 公司 在 协助 司法 机 关 等 第 三 方 调 取 数据 过 程 
中 ,可 以 收取 资料 .设备 .打印 .技术 等 成 本 费用 。 7” 


第 四 节 本 章 结 论 


在 当下 的 大 数据 建设 初期 ,可 能 大 部 分 人 的 关注 点 会 集中 在 大 数据 
侦查 的 技术 方法 上 。 然 而 ,大 数据 的 技术 特征 也 不 可 避免 地 会 对 现 有 的 
法 律 程序 ,法律 原则 带 来 冲击 。 若 想 要 在 未 来 真正 推广 .落实 大 数据 侦查 
技术 ,必须 解决 这 些 问题 ,通过 法 律 规 则 的 设计 ,来 协调 大 数据 侦查 对 现 
有 法 律 程序 .权利 所 带 来 的 冲击 。 从 权利 角度 来 看 “大 数据 监控 “大 数 
据 挖掘 ” 必 将 会 对 公民 的 隐私 权 、 个 人 信息 权 带 来 前 所 未 有 的 风险 ,应 当 
将 个 人 信息 权 保护 体系 中 的 相关 规定 吸收 至 大 数据 侦查 中 ,强调 个 人 参 
与 ,数据 有 限 使 用 等 原则 ,以 达到 个 人 信息 保护 与 数据 利用 的 最 佳 平衡 。 
从 程序 角度 来 看 ,应 当 将 正当 程序 原则 的 理念 、 要 求 融入 大 数据 侦查 的 程 
序 中 ,保障 因 大 数据 侦查 而 遭受 不 利 当 事 人 的 知情 、 提 出 异议 等 程序 
权利 。 

另外 ,大 数据 侦查 的 发 展 还 需要 一 些 相关 的 配套 制度 予以 支撑 。 从 体 
制 上 看 ,要 打破 数据 壁垒 限制 ,建立 侦查 机 关内 部 及 侦查 机 关 与 社会 行业 
的 数据 共享 机 制 。 从 技术 上 看 ,要 加 强大 数据 技术 基础 设施 、 软 硬件 产品 


C51) 王 燃 :《 大 数据 时 代 个 人 信息 保护 视野 下 的 电子 取证 ), 载 (山东 警察 学 院 学 报 》， 
2015(5) 。 
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的 建设 ,构建 数据 采集 、 数 据 交换 ,数据 分 析 的 大 数据 侦查 技术 体系 ,建立 
与 数据 共享 相配 套 的 大 数据 应 用 平台 。 需 要 注意 的 是 ,大 数据 公司 作为 大 
数据 侦查 的 重要 数据 和 技术 来 源 ,其 所 扮演 的 角色 及 相关 权利 、 义 务 也 不 
容 忽 略 。 大 数据 公司 应 当 建 立 数据 的 分 级 保护 制度 来 保障 公民 的 个 人 信 
息 权 ,通过 行业 规范 的 形式 来 对 大 数据 公司 与 侦查 机 关 的 数据 协作 、 数 据 
调 取 等 行为 进行 程序 上 的 衔接 。 
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结 论 


本 书 基于 前 沿 的 视角 ,构建 起 包括 大 数据 侦查 的 思维 .大 数据 侦查 模 
式 、 大 数据 侦查 方法 以 及 大 数据 侦查 相关 制度 的 完整 大 数据 侦查 体系 。 文 
章 中 很 多 制度 .规则 的 设计 都 是 基于 未 来 大 数据 侦查 发 展 的 预想 状态 ,很 
多 观点 也 带 有 一 定 的 前 脆性。 目前 实务 中 的 大 数据 侦查 正 处 于 快速 发 展 
的 阶段 。 例 如 ,2016 年 8 月 的 第 十 四 次 全 国 检察 工作 会 议 强 调 ,要 建设 国 
家 检察 大 数据 中 心 ,建立 检 务 大 数据 资源 库 ,并 提出 了 “大 数据 初 查 “ 大 数 
据 侦 查 ” 及 "大 数据 预防 ”。 不 少 检察 机 关 也 开始 践 行 大 数据 理念 ,例如 将 
大 数据 技术 用 于 职务 犯罪 初 查 工作 中 ,利用 大 数据 技术 对 职务 犯罪 进行 预 
测 ,预警 等 。 我 们 在 看 到 大 数据 的 广阔 发 展 前 景 ,推进 大 数据 侦查 的 同时 ， 
也 要 注意 把 握 以 下 要 点 。 

(1) 大 数据 侦查 不 仅仅 拘泥 于 事后 侦查 模式 。 传 统 的 侦查 一 般 都 以 立 
案 为 时 间 节 点 ,在 犯罪 行为 发 生 后 采取 侦查 措施 。 大 数据 侦查 强调 对 犯罪 
行为 的 预测 ,在 案件 还 没 发 生 之 前 或 者 发 生 过 程 中 就 将 其 及 时 识别 。 大 数 
据 侦 查 有 望 改变 人 类 长 久 以 来 的 司法 认 知 模式 ,构建 一 种 全 新 的 事前 侦查 
模式 。 能 够 对 公民 生命 .财产 等 权利 以 及 社会 秩序 起 到 更 好 地 保障 作用 。 

(2) 善于 运用 大 数据 的 相关 性 思维 。 发 掘 相关 关系 而 非 因 果 关 系 是 大 
数据 的 核心 思维 之 一 。 将 大 数据 的 相关 性 思维 用 于 侦查 工作 中 ,能 够 发 气 
事物 背后 隐藏 的 关系 ,发 现 更 多 的 案件 突破 口 。 因 此 ,侦查 人 员 要 注意 打 
破 传统 的 依赖 口供 、 物 证 的 僵化 思维 ,善于 运用 大 数据 思维 ,从 数据 空间 去 
寻找 相关 线索 、 证 据 。 

(3) 重视 大 数据 公司 的 重要 作用 。 尽 管 大 数据 公司 并 非法 定 侦 查 机 
关 , 但 是 在 大 数据 侦查 中 ,大 数据 公司 却 占 有 重要 地 位 。 它 们 掌握 着 海量 、 
新 鲜 的 大 数据 ,而 这 些 数据 恰恰 是 宝贵 的 侦查 资源 。 因 此 ,无 论 是 个 案 中 


大 数据 侦查 


的 数据 调 取 ,还 是 与 大 数据 公司 寻求 长 期 的 战略 合作 ,侦查 机 关 都 不 能 忽 
视 大 数据 公司 的 重要 地 位 。 大 数据 公司 也 应 当 尽 快 构建 与 司法 程序 相 衔 
接 的 数据 管理 制度 。 

(4) 注重 相关 权利 的 保障 制度 。 从 侦查 人 员 角 度 出 发 ,他 们 肯定 希望 
获取 的 数据 越 多 越 好 ,对 数据 的 挖掘 越 深 越 好 。 但 是 数据 的 收集 挖掘 必 
然 会 对 公民 个 人 信息 权 等 相关 权利 带 来 影响 ,对 一 些 既 有 法 律 程序 产生 冲 
击 。 因 此 ,必须 对 侦查 中 的 数据 运用 进行 规制 。 在 社会 主义 依法 治国 的 背 
景 下 ,本 书 强 调 大 数据 侦查 的 法 治 化 ,通过 相关 法 律 制 度 的 构建 来 规范 大 
数据 侦查 的 运用 ,以 保障 公民 的 相关 权利 。 

大 数据 侦查 最 本 质 的 理念 就 在 于 “大”。 哲 学 上 说 “量变 引起 质变 ”“ 整 
体 大 于 部 分 之 和 ”, 大 数据 侦查 正 是 这 样 一 种 “大 ”理念 的 体现 。 这 种 “大 ” 
理念 也 代表 了 一 种 当今 时 代 发 展 潮流 ,会 带 来 现 有 资源 格局 的 重新 洗 牌 ， 
引起 相关 制度 的 变革 。 例 如 现在 所 倡导 的 数据 开放 、 数 据 共享 就 是 "大 数 
据 ” 理 念 的 产物 ,再 如 近期 提出 的 “大 部 制 * 大 警 种 ”改革 则 是 “大 侦查 ” 理 
念 的 体现 "1 ”从 某 种 意义 上 来 说 ,“ 大 侦查 ” 比 “ 大 数据 侦查 ”更 进一步 ,其 
不 仅仅 是 数据 资源 的 整合 ,而 且 是 将 职能 相近 的 侦查 部 门 整合 为 一 个 较 大 
的 部 门 ,在 此 基础 上 实现 人 员 、 技 术 、 数 据 ` 信 息 等 大 量 资源 的 整合 及 效用 
发 挥 。 

2016 年 的 “十 三 五 ?规划 纲要 中 ,5? 2 再 次 强调 要 实施 国家 大 数据 战略 ,将 
大 数据 作为 基础 性 战略 资源 ,全 面 促进 大 数据 发 展 行动 。 其 实 , 不 仅仅 是 侦 
查 领域 ,各 行 各 业 都 应 当 深 化 大 数据 的 创新 应 用 ,探索 与 传统 业务 协同 发 展 
的 “大 数据 ?新 模式 。 顺 势 而 上 ,数据 为 王 。 人 类 将 真正 迎 来 大 数据 时 代 ! 


5C1] 2016 年 1 月 23 日 的 全 国 公安 厅 局 长 会 议 上 ,提出 要 进行 “大 部 制 “ 大 警 种 制 ?改革 ,将 
职能 相近 的 部 门 整 合 为 一 个 较 大 的 部 门 ,以 减少 机 构 重 释 、 职 能 交叉 的 问题 ,提高 协调 能 力 。 

52] 2016 年 3 月 16 日 ,第 十 二 届 全 国人 民 代 表 大 会 第 四 次 会 议 通过 了 《中 华人 民 共和 国 国 
民 经 济 和 社会 发 展 第 十 三 个 五 年 规划 纲要 》, 简 称 “ 十 三 五 ”规划 (2016 一 2020 年 ) ,其 中 第 二 十 七 章 
为 “实施 国家 大 数据 战略 ”。 
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后 记 


老师 说 后 记 一 定 要 写 人 学 时 的 故事 ,这 让 我 不 禁 想起 在 人 大 走 过 的 几 
载 春秋 , 从 一 个 擒 着 行李 箱 的 青 涩 少女 到 如 今 能 通过 博士 学 位 论文 答辩 的 
人 大 博士 研究 生 ,我 走 过 了 整整 五 年 的 路 程 。 这 期 间 我 的 每 一 点 进步 都 得 
益 于 人 大 各 位 老师 的 不 倦 教诲 ,得 益 于 各 位 同学 的 易 力 相助 ,感谢 冥 冥 之 
中 的 这 种 缘分 ,让 我 走 进 人 大 ,并 深 深 地 融入 其 中 。 

想起 在 山东 大 学 本 科大 二 时 我 对 民事 诉讼 法 产生 了 浓厚 的 兴趣 ,当时 
教 我 们 民 诉 课程 的 张海燕 老师 也 是 人 大 毕业 的 博士 生 。 就 是 因为 她 经 常 
跟 我 们 说 起 人 大 法 学 院 的 故事 ,让 我 不 知 不 觉 对 人 民 大 学 产生 了 无 限 的 恒 
慑 ,美好 而 遥远 。 本 科 时 用 的 证 据 学 课程 教材 及 法 律 英语 教材 是 何 家 弘 老 
师 编 著 的 ,当时 还 纳 闽 儿 这 会 不 会 是 同一 个 人 呢 , 后 来 得 知 何 老师 竟然 还 
会 写 侦探 小 说 ,心中 油 然 升 起 敬佩 之 情 。 没 想到 ,自己 竟然 有 一 天 成 为 何 
老师 的 学 生 ,这 是 当初 连 做 梦 也 没 敢 想 过 的 事 啊 ! 

想起 研究 生 入 学 考试 ,我 原本 的 意向 是 民事 诉讼 法 ,意外 被 调剂 到 了 
证 据 学 科 , 抽 签 时 又 有 幸 抽 到 了 何 老师 成 为 自己 的 导师 ,真是 说 不 出 来 的 
欣喜 与 激动 。 记 得 新 生 见 面 会 一 结束 , 刘 品 新 老师 就 把 我 们 几 位 新 同学 留 
下 来 , 送 给 了 我 们 一 人 一 本 《证 据 法 学 》, 从 那 时 起 ,研究 生 的 学 习 生 涯 正式 
开始 。 

想起 硕士 两 年 的 学 习 生 活 紧张 而 充实 。 一 人 学 我 便 接手 了 德 恒 证 据 
学 论坛 的 录音 整理 工作 ,跟着 何 老 师 参 加 刑事 错案 项 目 ,去 青岛 调研 ,去 长 
春 开会 。 在 何 老师 的 指导 下 ,硕士 期 间 还 写 了 几 篇 有 关 刑 事 错案 的 小 文 
章 , 居 然 发 表 了 ,更 激发 了 我 浓厚 的 学 术 兴 趣 。 我 深 深 体会 到 , 开 了 好 头 是 
坚持 走 下 去 的 关键 。 博 士 生 考试 时 上 天 又 一 次 眷顾 了 我 。2013 年 我 顺利 
成 为 何 老师 门下 的 博士 生 。 在 攻读 博士 的 三 年 里 , 何 老师 带 我 参加 了 《 述 
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到 的 正义 兴 外 国 司 法 判例 制度 》 等 书 的 写作 。 论 文 写作 期 间 , 何 老师 给 予 
了 莫大 的 鼓励 和 支持 ,不 厌 其 烦 地 解答 我 的 疑惑 。 尤 其 是 毕业 在 即 到 处 投 
简历 找 工作 那 段 时 间 , 何 老师 的 鼓励 让 我 终生 受用 ,每 次 面试 . 试 讲 之 前 ， 
老师 都 反复 叮嘱 我 要 再 自信 一 些 , 声 音 再 洪亮 一 些 。 这 时 的 何 老 师 是 恩 
师 ,更 是 长 辈 ,给 了 我 勇气 ,希望 和 温暖 。 

想起 刘 品 新 老师 , 刘 老 师 平日 一 直 视 我 为 自己 的 学 生来 要 求 。 说 实 
话 , 在 这 五 年 时 光 中 ,我 前 三 年 都 挺 怕 他 的 ,因为 他 对 我 们 学 生 的 要 求 特别 
严格 。 后 来 时 间 久 了 ,发 现 刘 老师 其 实 是 个 幽默 .风趣 、 才 华 横 溢 的 人 ,而 
且 他 是 我 见 过 的 智商 最 高 的 老师 (没有 之 一 )。 他 的 思路 与 常人 不 太一 样 ， 
总 是 能 给 我 们 一 团 糟 的 论文 擒 出 一 条 清晰 的 逻辑 主线 。 这 五 年 来 , 刘 老 师 
带 我 做 过 的 项 目 不 计 其 数 : 司法 判例 项 目 、 刑 事 错案 项 目 、 电 子 商务 立法 项 
目 、 网 络 安全 犯罪 项 目 , 等 等 。 如 今 还 经 常 回忆 起 我 们 与 老师 在 709 教室 
边 吃 饭 边 汇报 工作 的 场景 。 我 的 毕业 论文 题 ( 大 数据 侦查 研究 ) 也 得 益 于 
刘 老 师 的 建议 。 当 时 大 数据 尚未 如 此 火热 ,也 还 没有 国家 大 数据 战略 ,但 
刘 老 师 彼 时 即 认为 大 数据 至 少 在 未 来 十 年 都 会 成 为 主流 ,极力 建议 我 写 此 
题 。 如 今 时 代 的 发 展 已 然 证 实 了 刘 老 师 独到 的 眼光 。 

想起 论文 写作 过 程 中 , 刘 品 新 老师 给 予 我 太 多 的 帮助 和 鼓励 ,出 差 时 
搜集 各 种 实务 资料 ,有 什么 新 的 想法 也 建议 我 赶紧 写 人 论文 中 ,耐心 地 给 
我 提出 修改 建议 。 当 然 ,要 想得到 “ 傲 娇 ” 的 刘 老 师 的 肯定 是 非常 不 易 的 。 
至 今 还 记得 元 旦 时 初稿 交 上 去 后 刘 老 师 失 望 的 目光 ,直至 批阅 数 月 、 增 删 
五 次 后 老师 才 算 勉强 满意 过 关 。 那 也 是 写 论文 最 黑暗 的 一 段 时 光 , 一 个 人 
在 709 教室 没 日 没 夜 地 写 论文 , 直 到 农历 年 的 前 一 天 。 当 时 修改 论文 时 对 
刘 老 师 真是 又 恨 又 暗暗 佩服 ,现在 回想 起 来 ,还 是 从 心底 里 感激 刘 老 师 ! 

想起 李 学 军 老师 , 李 老 师 是 教研 室 为 数 不 多 的 女 老 师 之 一 。 她 温柔 、 
细腻 ,同时 又 不 失 威严 ,总 是 能 令 我 们 感受 到 母亲 般 的 关怀 。 至 今 还 记得 
2012 年 我 参加 “证 据 好 声音 ”演讲 ,当时 非常 紧张 ,是 李 学 军 老 师 的 一 席 话 
蔡 我 解 了 围 ,缓解 了 紧张 的 情绪 。 李 老师 给 我 们 最 深 的 印象 就 是 特别 真 
诚 , 无 论 是 讲课 还 是 课 下 相处 , 李 老 师 的 一 言 一 行 都 格外 用 心 。 无 论 什 么 
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时 候 给 李 老 师 发 短信 ,总 是 能 收 到 她 认真 的 回复 。 记 得 有 一 年 中 秋 节 时 李 
老师 给 我 们 每 一 位 同学 都 发 了 祝福 短信 ,让 我 们 在 外 的 学 子 心中 倍 感 温 
暧 。 论 文 预 答辩 时 , 李 老 师 指出 了 我 文章 中 一 个 较 大 的 漏洞 ,对 文章 中 格 
式 不 规范 处 甚至 是 错别字 ,都 一 一 指出 , 真 的 非常 感激 ! 

想起 证 据 学 教研 室 这 个 大 家 庭 给 了 我 太 多 温暖 的 回忆 。 刘 晓 丹 老师 、 
邓 稚 婷 老师 . 谢 君 泽 老师 、 毛 自荐 老师 、 许 明 老 师 都 曾 给 了 我 学 习 和 生活 上 
无 私 的 帮助 。 谢 君 泽 老 师 是 电子 取证 专家 ,他 对 大 数据 也 很 感 兴趣 ,经 常 
与 我 切磋 观点 ,给 论文 写作 带 来 了 不 少 灵 感 。 感 谢 季 美 君 师姐 、 郭 欣 阳 师 
姐 、 刘 为 军师 兄 、 雇 明 师 兄 、 梁 坤 师兄 、 杨 建国 师兄 、 张 晶 师 姐 、 马 哺 师 兄 等 
前 辈 , 对 我 这 些 年 学 习 和 生活 上 的 照顾 和 帮助 。 感 谢 张 晓 敏 、 徐 月 笛 、 朱 梦 
妮 , 张 洪 绪 、 翟 李鹏 . 黄 健 , 卞 嘉 虹 、 刘 译 矶 、. 张 艺 贞 、 宗 元 春 等 同窗 好 友 的 关 
心 。 尤 其 感谢 好 朋友 张 艺 贞 , 读 博 期 间 有 她 的 陪伴 ,我 们 共同 度 过 了 许多 
快乐 的 时 光 ! 感谢 刘 品 新 老师 和 谢 君 泽 老师 所 带领 的 电子 证 据 团 队 , 为 我 
论文 的 写作 提供 了 大 量 的 素材 和 技术 指导 。 

有 时 候 真 的 不 得 不 感慨 缘分 的 奇妙 。 硕 士 和 人 学 伊始 ,我 在 证 据 学 论坛 
上 认识 了 王 乐 园 同学 ,他 后 来 竟然 成 了 我 的 先生 。 还 记得 去 年 七 月 份 刚刚 
动笔 写作 时 的 焦灼 与 性 恺 , 正 是 他 的 开导 ,我 才 安 然 度 过 那 段 时 光 。 在 我 
找 工 作 期 间 , 他 总 是 推 掉 手 头 的 工作 ,请 假 去 陪 我 面试 . 送 材料 。 我 的 父母 
一 直 以 我 能 考 上 博士 而 骄傲 ,一 直 自 豪 地 对 别人 说 “我 女儿 是 博士 I "他们 
可 能 已 经 无 法 再 为 我 的 学 习 提 供 更 多 的 帮助 ,但 是 妈妈 每 天 都 会 打 电话 叮 
嘱 我 的 吃 穿 用 度 , 让 我 写 论文 不 要 太 累 了 ;有 一 段 时 间 我 着 急 上 火 脸 上 长 
辣 辣 ,爸爸 还 专门 配 了 中 药 寄 过 来 。 或 许 , 这 就 是 父母 对 孩子 的 爱 吧 。 还 
要 感谢 我 的 田 田 黎 向 柏 , 他 是 一 名 法 学 功底 深厚 的 基层 检察 官 。 当 年 , 正 
是 舅 田 引领 我 进入 法 学 之 门 , 从 本 科 到 博士 阶段 , 田 舅 一 直 是 我 最 亲切 的 

我 还 要 感谢 我 自己 ,认识 我 的 人 都 知道 我 有 一 项 爱好 一 一 花样 滑冰 ， 
至 今 已 练习 三 年 有 余 。 论 文 写作 期 间 , 迫 于 时 间 紧 张 , 曾 一 度 想 放弃 。 但 
仍然 咬牙 坚持 了 下 来 ,每 周 两 次 的 滑冰 训练 是 我 最 快乐 的 时 光 , 在 冰 上 放 
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空 一 切 ,专注 于 花样 滑冰 的 力 与 美 。 花 样 滑冰 给 了 我 健康 的 体魄 和 积极 向 
上 的 正 能 量 , 让 我 在 论文 写作 期 间 一 直 保持 良好 的 身心 状态 。 

感谢 人 生 让 我 有 着 许 许 多 多 经 历 , 有 欢笑 也 有 泪水 ,有 成 功 更 有 艰辛 ， 
无 论 结果 怎样 ,都 是 收获 ,是 成 长 的 历程 。 我 感谢 我 的 老师 、 同 学、 朋友 们 ， 
感谢 我 生活 几 年 的 中 国人 民 大 学 ,在 接 下 来 的 生活 中 ,无 论 我 在 哪 、 从 事 什 
么 工作 ,这 儿 年 的 时 光 都 是 我 巨大 的 财富 , 它 拓展 了 我 的 视野 、 丰 和 鱼 着 我 的 
心灵 、 照 亮 着 我 的 人 生 之 路 。 
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